L'apprentissage automatique, le domaine d'étude qui donne aux ordinateurs la capacité d'apprendre à partir de données, est au cœur de presque toutes les disciplines scientifiques, et l'étude de la généralisation (c'est-à-dire de la prédiction) à partir des données est le sujet central de l'apprentissage automatique. Ce cours donne une introduction de niveau supérieur à l'apprentissage automatique et une couverture approfondie des méthodes nouvelles et avancées en apprentissage automatique, ainsi que de leur théorie sous-jacente. Il met l'accent sur les approches présentant une pertinence pratique et examine un certain nombre d'applications récentes de l'apprentissage automatique, telles que l'exploration de données (en Big Data / Data Science, Data Analytics), le traitement du langage naturel, la vision par ordinateur, la robotique, la bioinformatique et le traitement de données texte et Web. L'apprentissage automatique est utilisé dans diverses industries, notamment les services financiers, le pétrole et le gaz, les soins de santé, le marketing et la publicité, le gouvernement, l'Internet et l'Internet des objets.
Ce cours couvre une variété de paradigmes d'apprentissage, d'algorithmes, de résultats théoriques et d'applications. Il utilise des concepts de base de l'intelligence artificielle, de la théorie de l'information, des statistiques et de la théorie du contrôle dans la mesure où ils sont pertinents pour l'apprentissage automatique. Les sujets comprennent: l'apprentissage supervisé (apprentissage génératif / discriminatif, apprentissage paramétrique / non paramétrique, réseaux de neurones, machines vectorielles de support, arbre de décision, apprentissage bayésien et optimisation); apprentissage non supervisé (clustering, réduction de dimensionnalité, méthodes de noyau); théorie de l'apprentissage (compromis biais / variance; théorie de la CV; grandes marges); apprentissage par renforcement et contrôle adaptatif. D'autres sujets incluent HMM (modèle de Markov caché), l'informatique évolutive, l'apprentissage en profondeur (avec des réseaux neuronaux) et la conception d'algorithmes dont les performances peuvent être rigoureusement analysées pour des problèmes fondamentaux d'apprentissage automatique. (Cours non offert au printemps 2021)
Une partie importante du cours est un projet de groupe. Les principaux outils open source utilisés pour l'apprentissage automatique parallèle, distribué et évolutif seront brièvement abordés pour aider les étudiants à réaliser les projets. (Unités 4) Condition préalable: Aucune.