Strojové učení je obor, který dává počítačům schopnost učit se z dat, je jádrem téměř každé vědecké disciplíny a studium zobecňování (tedy predikce) z dat je ústředním tématem strojového učení. Tento kurz poskytuje na úrovni absolventa úvod do strojového učení a hloubkové pokrytí nových a pokročilých metod strojového učení, stejně jako jejich základní teorie. Zdůrazňuje přístupy s praktickým významem a pojednává o řadě nedávných aplikací strojového učení, jako je dolování dat (v Big Data / Data Science, Data Analytics), zpracování přirozeného jazyka, počítačové vidění, robotika, bioinformatika a zpracování textových a webových dat. Strojové učení se používá v různých odvětvích včetně finančních služeb, ropy a zemního plynu, zdravotnictví, marketingu a reklamy, státní správy, internetu a internetu věcí.
Tento kurz zahrnuje celou řadu učebních paradigmat, algoritmů, teoretických výsledků a aplikací. Používá základní pojmy z umělé inteligence, teorie informací, statistiky a teorie řízení, pokud jsou relevantní pro strojové učení. Témata zahrnují: supervizované učení (generativní / diskriminační učení, parametrické / neparametrické učení, neuronové sítě, podpora vektorových strojů, rozhodovací strom, Bayesovské učení a optimalizace); bezobslužné učení (shlukování, redukce rozměrů, metody jádra); teorie učení (kompromisy zkreslení / odchylky; teorie VC; velké rezervy); posílení učení a adaptivní kontrola. Mezi další témata patří HMM (Hidden Markov Model), Evolutionary Computing, Deep Learning (With Neural Nets) a návrhové algoritmy, jejichž výkon lze důsledně analyzovat na základní problémy se strojovým učením.
Důležitou součástí kurzu je skupinový projekt. Hlavní nástroje s otevřeným zdrojovým kódem, které se používají pro paralelní, distribuované a škálovatelné strojní učení, budou stručně pokryty, aby pomohly studentům, kteří projekty provádějí. (Jednotky 4) Předpoklad: Žádný.