Parcours Machine learning, INtelligence artificielle et Données (MIND)
Le parcours MIND (préalablement nommé DAC) a pour objectif de former des experts dans les domaines de la science des données et de l'intelligence artificielle. Le parcours est articulé autour de trois grands profils de compétences : les données massives (base de données, algorithmique distribuée et passage à l’échelle), l'apprentissage statistique (machine learning, deep learning, IA générative) et l'apprentissage symbolique (déduction, causalité, logique formelle classique et logique floue).
Objectifs
La formation permet aux étudiantes et étudiants d’acquérir des connaissances théoriques fondamentales ainsi que des savoir-faire pratiques sur tous les domaines de l’intelligence artificielle centrée sur l’utilisation de données, la production de connaissances et l’implémentation de services intelligents :
- les bases de données pour la collecte, le stockage, la gestion et l’interrogation de grandes quantités de données complexes,
- la recherche d'information et la fouille de données pour le filtrage, l’analyse et l’extraction d’informations,
- l'apprentissage automatique, symbolique et profond pour l'entraînement de modèles, l'évaluation des performances, l'utilisation de modèles de fondations,
- l’intelligence computationnelle pour raisonner et exploiter des connaissances extraites à partir des données.
Débouchés
Le parcours MIND forme aux métiers industriels tels que concepteurs, développeurs et utilisateurs de systèmes intelligents, dans des secteurs où les compétences en traitement, analyse et valorisation des données sont essentielles (Data Scientist, Data Analyst, Data Architect, Data Engineer entre autres). Ces métiers, en constante évolution, nécessitent une mise à jour continue des connaissances scientifiques. Pour répondre à ces exigences, le programme intègre un solide volet théorique, permettant aux étudiant(e)s de s'adapter aux innovations technologiques. En parallèle, le parcours prépare fortement à la recherche scientifique et aux carrières en R&D.
Nos étudiants intègrent des entreprises de tout type (start-up, PMEs, grands groupes) et environ 30% d'entre eux poursuivent en thèse universitaire ou industrielle.
Programme
Organisation de la formation
Le premier semestre du M1 est un tronc commun offrant une importante mutualisation d'enseignements avec d'autres parcours de la mention informatique. Deux cours obligatoires et deux cours fortement conseillés introduisent :
- les modèles et les langages principaux pour le stockage et l'accès aux données structurées et sémantiques (MLBDA)
- les outils fondamentaux et les bonnes pratiques en science des données et en apprentissage machine (DALAS)
- La représentation et la gestion de connaissances (LRC)
- l’usage des approches probabilistes pour l’analyse de données (MAPSI).
Ces cours sont complétés par des cours d'autres parcours qui ont pour but de fournir un ensemble d'outils mathématiques et informatiques nécessaires à la formation ainsi que quelques ouvertures (programmation linéaire, graphes, traitement d’image, analyse de la complexité des algorithmes).
À partir du deuxième semestre du M1, nous proposons dans cette formation trois profils de compétences - Machine Learning, Bases de Données, Intelligence Artificielle - chacun donnant un ensemble de compétences spécifiques aux étudiantes et étudiants, via un agencement personnalisé d'UE. Ces trois profils de compétences sont :
- Le profil de compétences « Machine learning » propose des UE en machine learning, une introduction au deep learning, et une UE dans les domaines applicatifs de la recherche d'information et du traitement automatique de la langue naturelle.
- Le profil de compétences « Bases de Données » propose des UE dans le domaine des bases de données appliquées à la gestion de données complexes et distribuées à large échelle.
- Le profil de compétences « Intelligence Artificielle » propose des UE dans les domaines de la modélisation de connaissances et de l'apprentissage symbolique appliqués aux informations complexes et incertaines (documents, web sémantique).
Les UE de chaque profil sont complémentaires aux UE des deux autres profils et permettent aux étudiantes et étudiants de personnaliser leur formation.
Le premier semestre du M2 offre des UE pointues qui donnent chacune un ensemble de compétences spécifiques par rapport aux différents profils (Deep Learning, Large Langage Model, IA pour la science, Big Data, Graphes de connaissance, IA interprétable). L'orientation des étudiantes et étudiants vers un métier se fera par leur stage au deuxième semestre de M2 et pourra être réalisé dans un laboratoire de recherche ou dans une entreprise, avec l'accent mis soit sur la recherche soit sur le développement.
Les étudiantes et étudiants inscrits en Master M2 DAC et ayant les prérequis suffisants peuvent suivre des UE abordant des aspects mathématiques avancés (optimisation convexe, non convexe, apprentissage statistique et automatique) proposées parle master M2A (m2a.lip6.fr).
Premier semestre (M1-S1)
Il faut choisir 5 UEs à choisir parmi les UEs suivantes et suivre l’UE d’Insertion Professionelle (IP).
Acronyme | Intitulé | ECTS | Parcours | Utilité |
MLBDA | Modèles et Langages Bases de Données Avancées | 6 | MIND | Obligatoire |
DALAS | DatA science, Learning and ApplicationS | 6 | MIND | Obligatoire |
LRC | Logique et Représentations des Connaissances | 6 | AI2D/MIND | Recommandée |
MAPSI | Modèles et Algorithmes Probabilistes et Statistiques pour l'Informatique | 6 | MIND/IMA | Recommandée |
BIMA | Bases du Traitement des Images | 6 | IMA | Conseillée |
MOGPL | Modélisations, Optimisation, Graphes, et Programmation Linéaire | 6 | AI2D | Conseillée |
COMPLEX | Complexité, Algorithmes Probabilistes et Approchés | 6 | CCA | Conseillée |
MODEL | Modélisations numériques et symboliques | 6 | BIM | Conseillée |
Deuxième semestre (M1-S2)
Le second semestre est composé :
- de 2 UEs obligatoires :
Acronyme | Intitulé | ECTS |
PMIND | Projet logiciel, recherche bibliographique et conférences métiers | 3 |
Anglais | Anglais |
3 |
- et de 4 UEs à choisir parmi celles ci-dessous :
Acronyme | Intitulé | ECTS |
RITAL | Recherche d’Information et Traitement Automatique du Langage Naturel | 6 |
ML | Machine Learning | 6 |
IDLE | Introduction au Deep Learning | 6 |
IAMSI | Intelligence Artificielle et Manipulation Symbolique de l’Information | 6 |
SAM | Stockage et Accès aux Mégadonnées (Scalable Datastores) | 6 |
DJ | Décision et jeux | 6 |
Semestre 3
Lors de ce semestre, la première UE (Deep-L) est obligatoire. Il est conseillé de choisir également au moins 2 autres UE parmi celles à 6 ECTS (LSDA, XAI, MEDS et RDFIA). Puis choisir d'autres UE parmi celles à 3 ECTS (GDC, SACE, RL, NWDLE, LLM) pour totaliser 30 ECTS.
Acronyme | Intitulé | ECTS | Parcours |
Deep-L | Deep Learning | 6 | DAC |
LSDA | Large-Scale Data Analytics | 6 | DAC |
XAI | eXplainable Artificial Intelligence | 6 | DAC |
MEDS | Methodology in Data Science and Research | 6 | DAC |
GDC | Graphes de données et de connaissances | 3 | DAC |
SACE | Symbolic Approaches for Computational Ethics | 3 | DAC |
RL | Reinforcement Learning (dépendance à Deep-L) | 3 | DAC |
NWDLE | New Trends in Deep Learning | 3 | DAC |
LLM | Large Language Models | 3 | DAC |
RDFIA | Reconnaissance des formes pour l’analyse et l’interprétation d’images | 6 | IMA |
Semestre 4
Acronyme | Intitulé | ECTS | Parcours |
Stage | Stage de fin de Master 2 | 27 | DAC |
IP | Insertion Professionnelle | 3 | DAC |
Compétences
À l'obtention du diplôme, la ou le diplômé devra maîtriser les compétences disciplinaires suivantes :
- Connaître et mettre en œuvre les principes de gestion des bases de données structurées ou non.
- Créer, gérer et exploiter des bases de données, s’assurer de la qualité de ces bases pour garantir un accès fiable aux données.
- Collecter, pré-processer, analyser et traiter des données
- Maîtriser des outils numériques et langages de programmation de référence en IA
- Sélectionner, mettre en œuvre les algorithmes de machine learning et de deep learning pour une problématique donnée.
- Modéliser mathématiquement un problème d'IA afin de le résoudre.
- Appréhender un problème ou une problématique métier afin d'identifier les besoins en science des données, IA et base de données.
- Mettre en œuvre et déployer des méthodes de science des données dans le contexte métier pour répondre aux attentes du secteur d’activité.
- Évaluer les performances d'un système d'IA en rapport avec les objectifs métier.
- Expliquer un système d'IA.
Public visé et prérequis
Le recrutement en M1 est essentiellement réalisé au niveau L3 (ou équivalent) en Informatique ou Informatique/Mathématiques. Des candidatures bien motivées provenant d’autres domaines scientifiques peuvent également être considérées.
Au niveau M2 le parcours peut accueillir quelques candidates et candidats extérieurs avec les prérequis compatibles, et en particulier des étudiantes et étudiants en dernière année d’écoles d’ingénieur qui veulent faire un double diplôme ayant déjà un début de formation en IA.
Les candidates et candidats doivent avoir des solides connaissances en informatique (algorithmique et programmation, bases de données, logique). Des notions fondamentales en mathématiques (probabilités, statistiques, analyse, algèbre) sont requises.
Le parcours MIND n’est pas proposé en alternance.
Contacts
Secrétariat
Géraldine BOMPARD