Parcours Machine learning, INtelligence artificielle et Données (MIND)

Le parcours MIND (préalablement nommé DAC) a pour objectif de former des experts dans les domaines de la science des données et de l'intelligence artificielle. Le parcours est articulé autour de trois grands profils de compétences : les données massives (base de données, algorithmique distribuée et passage à l’échelle), l'apprentissage statistique (machine learning, deep learning, IA générative) et l'apprentissage symbolique (déduction, causalité, logique formelle classique et logique floue). 

Parcours Machine learning, INtelligence artificielle et Données (MIND)

Objectifs

La formation permet aux étudiantes et étudiants d’acquérir des connaissances théoriques fondamentales ainsi que des savoir-faire pratiques sur tous les domaines de l’intelligence artificielle centrée sur l’utilisation de données, la production de connaissances et l’implémentation de services intelligents :

  • les bases de données pour la collecte, le stockage, la gestion et l’interrogation de grandes quantités de données complexes,
  • la recherche d'information et la fouille de données pour le filtrage, l’analyse et l’extraction d’informations,
  • l'apprentissage automatique, symbolique et profond  pour  l'entraînement de modèles, l'évaluation des performances, l'utilisation de modèles de fondations,
  • l’intelligence computationnelle pour raisonner et exploiter des connaissances extraites à partir des données.

Débouchés

Le parcours MIND forme aux métiers industriels tels que concepteurs, développeurs et utilisateurs de systèmes intelligents, dans des secteurs où les compétences en traitement, analyse et valorisation des données sont essentielles (Data Scientist, Data Analyst, Data Architect, Data Engineer entre autres). Ces métiers, en constante évolution, nécessitent une mise à jour continue des connaissances scientifiques. Pour répondre à ces exigences, le programme intègre un solide volet théorique, permettant aux étudiant(e)s de s'adapter aux innovations technologiques. En parallèle, le parcours prépare fortement à la recherche scientifique et aux carrières en R&D.

Nos étudiants intègrent des entreprises de tout type (start-up, PMEs, grands groupes) et environ 30% d'entre eux  poursuivent en thèse universitaire ou industrielle.

Programme

Organisation de la formation

Le premier semestre du M1 est un tronc commun offrant une importante mutualisation d'enseignements avec d'autres parcours de la mention informatique. Deux cours obligatoires et deux cours fortement conseillés introduisent :

  • les modèles et les langages principaux pour le stockage et l'accès aux données structurées et sémantiques  (MLBDA)
  • les outils fondamentaux et les bonnes pratiques en science des données et en apprentissage machine (DALAS)
  • La représentation et la gestion de connaissances (LRC)
  • l’usage des approches probabilistes pour l’analyse de données (MAPSI).

Ces cours sont complétés par des cours d'autres parcours qui ont pour but de fournir un ensemble d'outils mathématiques et informatiques nécessaires à la formation ainsi que quelques ouvertures (programmation linéaire, graphes, traitement d’image, analyse de la complexité des algorithmes). 

À partir du deuxième semestre du M1, nous proposons dans cette formation trois profils de compétences - Machine Learning, Bases de Données, Intelligence Artificielle - chacun donnant un ensemble de compétences spécifiques aux étudiantes et étudiants, via un agencement personnalisé d'UE. Ces trois profils de compétences sont :

  • Le profil de compétences « Machine learning » propose des UE en machine learning, une introduction au deep learning, et une UE dans les domaines applicatifs de la recherche d'information  et du traitement automatique de la langue naturelle.
  • Le profil de compétences « Bases de Données »  propose des UE dans le domaine des bases de données appliquées à la gestion de données complexes et distribuées à large échelle.  
  • Le profil de compétences « Intelligence Artificielle » propose des UE dans les domaines de la modélisation de connaissances et de l'apprentissage symbolique appliqués aux informations complexes et incertaines (documents, web sémantique).

Les UE de chaque profil sont complémentaires aux UE des deux autres profils et permettent aux étudiantes et étudiants de personnaliser leur formation.

Le premier semestre du M2 offre des UE pointues qui donnent chacune un ensemble de compétences spécifiques par rapport aux différents profils (Deep Learning, Large Langage Model, IA pour la science, Big Data, Graphes de connaissance, IA interprétable). L'orientation des étudiantes et étudiants vers un métier se fera par leur stage au deuxième semestre de M2 et pourra être réalisé dans un laboratoire de recherche ou dans une entreprise, avec l'accent mis soit sur la recherche soit sur le développement.

Les étudiantes et étudiants inscrits en Master M2 DAC et ayant les prérequis suffisants peuvent suivre des UE abordant des aspects mathématiques avancés (optimisation convexe, non convexe, apprentissage statistique et automatique) proposées parle master M2A (m2a.lip6.fr).

Premier semestre (M1-S1)

Il faut choisir 5 UEs à choisir parmi les UEs suivantes et suivre l’UE d’Insertion Professionelle (IP).

Acronyme Intitulé ECTS Parcours Utilité
MLBDA Modèles et Langages Bases de Données Avancées 6 MIND Obligatoire
DALAS DatA science, Learning and ApplicationS 6 MIND Obligatoire
LRC Logique et Représentations des Connaissances 6 AI2D/MIND Recommandée
MAPSI Modèles et Algorithmes Probabilistes et Statistiques pour l'Informatique 6 MIND/IMA Recommandée
BIMA Bases du Traitement des Images 6 IMA Conseillée
MOGPL Modélisations, Optimisation, Graphes, et Programmation Linéaire 6 AI2D Conseillée
COMPLEX Complexité, Algorithmes Probabilistes et Approchés 6 CCA Conseillée
MODEL Modélisations numériques et symboliques 6 BIM Conseillée

Deuxième semestre (M1-S2)

Le second semestre est composé :

  • de 2 UEs obligatoires : 
Acronyme Intitulé ECTS
PMIND Projet logiciel, recherche bibliographique et conférences métiers 3
Anglais Anglais

3

 

  • et de 4 UEs à choisir parmi celles ci-dessous :
Acronyme Intitulé ECTS
RITAL Recherche d’Information et Traitement Automatique du Langage Naturel 6
ML Machine Learning 6
IDLE Introduction au Deep Learning 6
IAMSI Intelligence Artificielle et Manipulation Symbolique de l’Information 6
SAM Stockage et Accès aux Mégadonnées (Scalable Datastores) 6
DJ Décision et jeux 6

Semestre 3

Lors de ce semestre, la première UE (Deep-L) est obligatoire. Il est conseillé de choisir également au moins 2 autres UE parmi celles à 6 ECTS (LSDA, XAI, MEDS et RDFIA). Puis choisir d'autres UE parmi celles à 3 ECTS (GDC, SACE, RL, NWDLE, LLM) pour totaliser 30 ECTS.

Acronyme Intitulé ECTS Parcours
Deep-L Deep Learning 6 DAC
LSDA Large-Scale Data Analytics 6 DAC
XAI eXplainable Artificial Intelligence 6 DAC
MEDS Methodology in Data Science and Research 6 DAC
GDC Graphes de données et de connaissances 3 DAC
SACE Symbolic Approaches for Computational Ethics 3 DAC
RL Reinforcement Learning (dépendance à Deep-L) 3 DAC
NWDLE New Trends in Deep Learning 3 DAC
LLM Large Language Models 3 DAC
RDFIA Reconnaissance des formes pour l’analyse et l’interprétation d’images 6 IMA

Semestre 4

Acronyme Intitulé ECTS Parcours
Stage Stage de fin de Master 2 27 DAC
IP Insertion Professionnelle 3 DAC

Compétences

À l'obtention du diplôme, la ou le diplômé devra maîtriser les compétences disciplinaires suivantes :

  • Connaître et mettre en œuvre les principes de gestion des bases de données structurées ou non.
  • Créer, gérer et exploiter des bases de données, s’assurer de la qualité de ces bases pour garantir un accès fiable aux données.
  • Collecter, pré-processer, analyser et traiter des données
  • Maîtriser des outils numériques et langages de programmation de référence en IA
  • Sélectionner, mettre en œuvre les algorithmes de machine learning et de deep learning pour une problématique donnée.
  • Modéliser mathématiquement un problème d'IA afin de le résoudre.
  • Appréhender un problème ou une problématique métier afin d'identifier les besoins en science des données, IA et base de données.
  • Mettre en œuvre et déployer des méthodes de science des données dans le contexte métier pour répondre aux attentes du secteur d’activité.
  • Évaluer les performances d'un système d'IA en rapport avec les objectifs métier.
  • Expliquer un système d'IA.

Public visé et prérequis

Le recrutement en M1 est essentiellement réalisé au niveau L3 (ou équivalent) en Informatique ou Informatique/Mathématiques. Des candidatures bien motivées provenant d’autres domaines scientifiques peuvent également être considérées.

Au niveau M2 le parcours peut accueillir quelques candidates et candidats extérieurs avec les prérequis compatibles, et  en particulier des étudiantes et étudiants en dernière année d’écoles d’ingénieur qui veulent faire un double diplôme ayant déjà un début de formation en IA.

Les candidates et candidats doivent avoir des solides connaissances en informatique (algorithmique et programmation, bases de données, logique). Des notions fondamentales en mathématiques (probabilités, statistiques, analyse, algèbre) sont requises.

Le parcours MIND n’est pas proposé en alternance.

Contacts