L’intelligence artificielle moderne tire profit de deux grands avantages indéniables : la disponibilité des données et la force de calcul. Les données, vraie mine d’informations, sont maintenant disponibles, souvent en grandes quantités et issues de sources multiples et pouvant être entachées d’imperfections diverses (données manquantes, imprécises, hétérogènes, etc.). La gestion de ces données massives et hétérogènes soulève plusieurs défis à la communauté IA. De la fouille de données à l’apprentissage artificiel, plusieurs problèmes d’actualité nécessitent des solutions efficaces au point de vue calculatoire et pouvant fournir des résultats exploitables, fiables et explicables pour l’utilisateur.

Ainsi, le nouvel axe thématique “Données” au sein du CRIL se fixe comme principaux objectifs :

  • La proposition de nouveaux algorithmes d’extraction de connaissances et d’apprentissage automatique ;
  • L’étude et l’analyse des aspects fondamentaux, algorithmiques et expérimentaux des techniques d’extraction de connaissances et d’apprentissage automatique ;
  • La proposition de solutions efficaces pour la gestion de données massives, hétérogènes et complexes en intégrant les dimensions de confidentialité et de fiabilité ;
  • La fertilisation croisée et l’exploitation des synergies fortes avec les deux autres axes thématiques du CRIL (comme le développement d’approches symboliques et déclaratives pour la fouille de données et l’explicabilité prenant appui sur la force des solveurs et raisonneurs modernes) ;
  • La collecte, la complétion et l’interrogation de bases de données massives et hétérogènes ;
  • La modélisation et conception de pipelines d’extraction de connaissances et d’apprentissage artificiel dans certains domaines applicatifs.

Mots clés :

Fouille et science des données

extraction de connaissances (extraction de motifs et de règles, clustering, communautés…), approches déclaratives, qualité des données

Apprentissage automatique

apprentissage automatique et explicabilité, fiabilité, calibration

Gestion des données

Interrogation, complétion, contrôle d’accès, confidentialité, réparation

Applications

Recommandation, détection d’anomalies, détection de communautés…