Parcours Données, Apprentissage, Connaissances (DAC)

Tous les secteurs industriels et économiques sont confrontés à une explosion de données générées par leurs activités et collectées par des infrastructures (capteurs, réseaux, bases de données) de plus en plus performantes. Les acteurs concernés découvrent progressivement le potentiel de ces données pour l’enrichissement et l’optimisation de leur activité grâce à des nouvelles technologies informatiques pour stocker, gérer et analyser des grandes quantités de données et des outils avancés pour extraire et visualiser de l’information utile et synthétique.

Le développement de ces nouveaux outils nécessite des expertes et experts en « science de données » (data scientists) avec des connaissances fondamentales en informatique et en statistique et une bonne maîtrise des technologies informatiques associées.

Parcours Données, Apprentissage, Connaissances (DAC)

Objectifs

L'objectif pédagogique du parcours DAC est de donner des connaissances fondamentales concernant tous les domaines de l’intelligence artificielle centrée sur l’utilisation de données, la production de connaissances et l’implémentation de services intelligents :

  • les bases de données pour la collecte, le stockage, la gestion et l’interrogation de grandes quantités de données complexes,
  • la recherche d'information et la fouille de données pour le filtrage, l’analyse et l’extraction d’informations,
  • l'apprentissage automatique pour extraire des modèles statistiques et symboliques à partir de données imparfaites,
  • l’intelligence computationnelle pour raisonner et exploiter des connaissances extraites à partir des données.
     

Débouchés

Les métiers visés par le parcours DAC sont des emplois de concepteurs, de développeurs et d'utilisateurs d'outils intelligents dans tous les domaines importants nécessitant des compétences fortes en traitement, analyse, enrichissement des données. L’expertise nécessaire pour ces métiers évoluent rapidement et nécessite le suivi continu des activités et résultats scientifiques concernés. Le parcours DAC vise également des emplois dans la recherche scientifique et la R&D. 

On peut citer les domaines suivants :

  • Gestion du Web, Web advertising, Conception de plateformes sociales
  • Business Intelligence, Customer Relationship Management (CRM)
  • Recherche d'informations et moteurs de recherche sur le web et dans des plateformes sociales
  • Database tuning (administrateur de BD), Data analyst, Data architect, Data Engineer, Data manager on distributed architectures (cloud, data grid, data center), Scientific data manager, technology watch, Web architect

Les entreprises typiquement intéressées par le profil des étudiantes et étudiants de ce parcours sont des acteurs du traitement de l'information, industriels (OpenData, Etalab, Internet memory, Google, Yahoo !) ou académiques (BNF, INA), des grandes entreprises exploitant des solutions complexes telles que SAP (Accenture, Total), de la recherche d'information et de la fouille de données (Exalead, BlogSpirit, KXEN), ainsi que des grands groupes dans des domaines divers tels que la finance...

Du point de vue académique, le parcours ouvre naturellement vers des postes d'enseignante-chercheuse ou enseignant-chercheur et de chercheuse ou chercheur. Le but est de conserver un taux de poursuite en thèse de l'ordre de 50 %.

Programme

Organisation de la formation

Le premier semestre du M1 est un tronc commun offrant une importante mutualisation d'enseignements avec d'autres parcours de la mention informatique. Deux cours obligatoires introduisent les modèles et les langages principaux pour le stockage et l'accès aux données structurées et sémantiques et pour la représentation de connaissances. Ces deux cours sont complétés par des cours d'autres parcours qui ont pour but de fournir un ensemble d'outils mathématiques et informatiques nécessaires à la formation ainsi que quelques ouvertures. Sous réserve de compatibilité d'emploi du temps, nous permettrons également aux étudiantes et étudiants qui le souhaitent de suivre une UE dite «libre» (appartenant à un autre parcours du Master Informatique, voire à un autre Master), qui n'apparaît pas dans le tableau suivant, et qui correspondrait à un projet professionnel cohérent.
À partir du deuxième semestre du M1, nous proposons dans cette formation trois profils de compétences, chacun donnant un ensemble de compétences spécifiques aux étudiantes et étudiants, via un agencement d'UE personnalisé. Ces trois profils de compétences sont :

  • Le profil de compétences « Apprentissage » (APP) propose des UE dans les domaines de la recherche d'information et la fouille de données appliqués à l'analyse de données complexes, la veille scientifique et industrielle et les médias sociaux.
  • Le profil de compétences « Bases de Données » (BD) propose des UE dans le domaine des bases de données appliquées à la gestion de données complexes et distribuées large-échelle.
  • Le profil de compétences « Intelligence Artificielle » (IA) propose des UE dans les domaines de la modélisation de connaissances et de l'apprentissage symbolique appliqués aux informations complexes et incertaines (documents, web sémantique).

Les UE de chaque profil sont complémentaires aux UE des deux autres profils et permettent aux étudiantes et étudiants de personnaliser leur formation.

Le premier semestre du M2 offre des UE pointues qui donnent chacune un ensemble de compétences spécifiques par rapport aux différents profils. L'orientation des étudiantes et étudiants vers un métier se fera par leur stage au deuxième semestre de M2 qui a lieu pendant tout le second semestre et pourra être réalisé dans un laboratoire de recherche ou dans une entreprise, avec l'accent mis soit sur la recherche soit sur le développement.

Les étudiantes et étudiants inscrits en Master M2 DAC et ayant les prérequis suffisants peuvent suivre des UE abordant des aspects mathématiques avancés (optimisation convexe, non convexe, apprentissage statistique et automatique). Voir le contenu détaillé sur m2a.lip6.fr
 

Premier semestre (M1-S1)

Il faut choisir 5 UEs à choisir parmi les UEs suivantes et suivre l’UE d’Insertion Professionelle (IP).

Acronyme Intitulé ECTS Parcours Utilité
MLBDA Modèles et Langages Bases de Données Avancées 6 DAC/ANDROIDE Obligatoire
LRC Logique et Représentations des Connaissances 6 ANDROIDE/DAC Obligatoire
MAPSI Modèles et Algorithmes Probabilistes et Statistiques pour l'Informatique 6 DAC/IMA Très Recommandée
IL Ingénierie du Logiciel 6 STL Conseillée
COMPLEX Complexité, Algorithmes Probabilistes et Approchés 6 SFPN Conseillée
MODEL Modélisations numériques et symboliques 6 BIM Conseillée
MOGPL Modélisations, Optimisation, Graphes, et Programmation Linéaire 6 ANDROIDE Conseillée
BIMA Bases du Traitement des Images 6 IMA Conseillée

Deuxième semestre (M1-S2)

Le second semestre est composé :

  • de 2 UEs obligatoires : 
Acronyme Intitulé ECTS
PLDAC Projet logiciel, recherche bibliographique et conférences métiers 3
Anglais Anglais

3

 

  • et de 4 UEs à choisir parmi celles ci-dessous :
Acronyme Intitulé ECTS
IAMSI Intelligence Artificielle et Manipulation Symbolique de l’Information 6
ML Machine Learning 6
RITAL Recherche d’Information et Traitement Automatique du Langage Naturel 6
SAM Stockage et Accès aux Mégadonnées (Scalable Datastores) 6
DJ Décision et jeux 6

Semestre 3

Lors de ce semestre, il y a 5 UE à choisir dans le tableau ci-dessous, dont 4 parmi les 6 premiers (parcours DAC).

Acronyme Intitulé ECTS Parcours
AMAL Advanced MAchine Learning and Deep Learning 6 DAC
BDLE Bases de Données Large Echelle 6 DAC
XAI eXplainable Artificial Intelligence 6 DAC
REDS Research in Data Science and Methodology 6 DAC
LODAS Linked Open Data, Apprentisssage Symbolique 6 DAC
AMAL [dépendance à AMAL] Reinforcement Learning and advanced Deep Learning 6 DAC
RDFIA Reconnaissance des formes pour l’analyse et l’interprétation d’images 6 IMA

Semestre 4

Acronyme Intitulé ECTS Parcours
Stage Stage de fin de Master 2 27 DAC
IP Insertion Professionnelle 3 DAC

Compétences

À l'obtention du diplôme, la ou le diplômé devra maîtriser :

  • les enjeux, les problématiques et le contexte du traitement de l'information à grande échelle
  • les outils de base de l'intelligence artificielle
  • les technologies symboliques et numériques pour l'apprentissage automatique à partir de données
  • les outils de base pour la recherche d'information
  • les différents constituants d'un outil opérationnel de fouille de données
  • le fonctionnement des moteurs de recherche, texte, image, parole, vidéo.

Il sera également capable de mettre en œuvre et d'apporter de l'innovation pour la conception :

  • de systèmes de gestion, de collecte et d'analyse de données à grande échelle,
  • d'outils de fouille de données, de recherche d'information, de veille technologique,
  • d'algorithmes d'apprentissage automatique et de reconnaissance des formes.

Public visé et prérequis

Le recrutement en M1 est essentiellement réalisé au niveau L3 (ou équivalent) en Informatique ou Informatique/Mathématique. Des candidatures bien motivées provenant d’autres domaines scientifiques peuvent également être considérées.

Au niveau M2 le parcours peut accueillir quelques candidates et candidats extérieurs avec les prérequis compatibles, et  en particulier des étudiantes et étudiants en dernière année d’écoles d’ingénieur (Centrale, CNAM, ENSIIE, EPITA, ParisTech, etc.) qui veulent faire un double diplôme.

Les candidates et candidats doivent avoir des solides connaissances en informatique (algorithmique et programmation, bases de données, logique…). Des notions fondamentales en mathématique (probabilités, statistiques) sont fortement conseillées.