El aprendizaje automático es el campo de estudio que brinda a las computadoras la capacidad de aprender de los datos, está en el corazón de casi todas las disciplinas científicas, y el estudio de la generalización (es decir, la predicción) a partir de los datos es el tema central del aprendizaje automático. Este curso ofrece una introducción a nivel de posgrado al aprendizaje automático y una cobertura en profundidad de métodos nuevos y avanzados en el aprendizaje automático, así como su teoría subyacente. Enfatiza enfoques con relevancia práctica y analiza una serie de aplicaciones recientes del aprendizaje automático, como la minería de datos (en Big Data / ciencia de datos, análisis de datos), procesamiento de lenguaje natural, visión por computadora, robótica, bioinformática y procesamiento de datos de texto y web. El aprendizaje automático se utiliza en diversas industrias, incluidas las de servicios financieros, petróleo y gas, atención médica, marketing y publicidad, gobierno, Internet e Internet de las cosas.
Este curso cubre una variedad de paradigmas de aprendizaje, algoritmos, resultados teóricos y aplicaciones. Utiliza conceptos básicos de inteligencia artificial, teoría de la información, estadística y teoría de control en la medida en que sean relevantes para el aprendizaje automático. Los temas incluyen: aprendizaje supervisado (aprendizaje generativo / discriminativo, aprendizaje paramétrico / no paramétrico, redes neuronales, máquinas de vectores de apoyo, árbol de decisiones, aprendizaje y optimización bayesianos); aprendizaje no supervisado (agrupamiento, reducción de dimensionalidad, métodos de kernel); teoría del aprendizaje (compensaciones de sesgo / varianza; teoría de VC; márgenes grandes); aprendizaje por refuerzo y control adaptativo. Otros temas incluyen HMM (modelo oculto de Markov), computación evolutiva, aprendizaje profundo (con redes neuronales) y el diseño de algoritmos cuyo rendimiento se puede analizar rigurosamente para detectar problemas fundamentales de aprendizaje automático.
Una parte importante del curso es un proyecto grupal. Las principales herramientas de código abierto utilizadas para el aprendizaje automático paralelo, distribuido y escalable se cubrirán brevemente para ayudar a los estudiantes a realizar los proyectos. (Unidades 4) Prerrequisito: Ninguno.