机器学习是使计算机具有从数据中学习的能力的研究领域,几乎是每门科学学科的核心,而对数据的概括性(即预测)的研究则是机器学习的中心主题。 本课程对机器学习进行了研究生级别的介绍,并深入介绍了机器学习中的新方法和高级方法及其基础理论。 它强调与实践相关的方法,并讨论了机器学习的许多最新应用,例如数据挖掘(在大数据/数据科学,数据分析中),自然语言处理,计算机视觉,机器人技术,生物信息学以及文本和Web数据处理。 机器学习被广泛应用于各个行业,包括金融服务,石油和天然气,医疗保健,市场营销与广告,政府,互联网和物联网。
本课程涵盖各种学习范例,算法,理论结果和应用。 它使用了人工智能,信息论,统计学和控制论等与机器学习相关的基本概念。 主题包括:有监督的学习(生成/区分学习,参数/非参数学习,神经网络,支持向量机,决策树,贝叶斯学习和优化); 无监督学习(聚类,降维,核方法); 学习理论(偏见/方差权衡; VC理论;大幅度利润); 强化学习和自适应控制。 其他主题包括HMM(隐马尔可夫模型),进化计算,深度学习(具有神经网络)和设计算法,其性能可以针对基本的机器学习问题进行严格分析。 (课程未提供2021年春季)
课程的一个重要部分是小组项目。 将简要介绍用于并行,分布式和可扩展机器学习的主要开源工具,以帮助学生完成项目。 (4单位)先决条件:无。