Py学习  »  机器学习算法

【新手册】机器学习:讲义笔记

专知 • 11 月前 • 173 次点击  

编写讲义为了教授纽约大学数据科学中心课程 DS-GA 1003 “机器学习”。数据科学方向硕士博士研究生开设机器学习课程,我的目标学生打下坚实基础,以便他们今后能够进一步学习先进现代机器学习、数据科学,乃至广义人工智能相关主题。

基于目标,讲义包含大量关于机器学习各类概念的数学推导。当然,成为学生放弃阅读障碍,因为我在推导过程尽量穿插直观解释背后洞察,帮助学生理解背后原理。

编写过程中,我也逐渐意识自己机器学习方面基础仍有不足。尽力而为。

撰写讲义过程中,始终努力提醒自己记 Richard Sutton 提出的“痛苦教训”(Bitter Lesson)[Sutton, 2019]。因此,我在呈现各种算法、模型理论时,力求支持扩展实现(无论计算资源还是数据规模上)方式进行讲解。讲义中的所有机器学习算法,随机梯度下降(SGD)及其变体核心进行介绍。当然,扩展包括其他方面,例如分布计算,期望高级课程能够课程打下基础继续深入这些主题。

尽管 本意尽可能所有基础主题,很快便意识课程时间不足深入探讨一个内容。因此,不得不做出一些艰难取舍,舍弃一些认为基础有趣重要主题,例如线学习、方法以及缺失处理等。

另外,也有一些有意省略主题,尽管它们同样是基础内容,已经其他课程中有广泛讲授,比如序列模(大规模语言模)。我也刻意回避具体应用领域讨论,期望学生专注应用课程深入学习这些方向,例如计算视觉、计算生物自然语言处理等。

还有一些原本希望时间 限制未能涉及现代主题,包括基于微分方程(ODE)生成模型,以及用于表示学习度量学习对比学习等。或许未来可以机器学习课程扩展一个课程系列,这些内容纳入其中。在此之前,学生需要通过其他资源学习这些先进内容。

讲义并非参考书,而是教学目的编写的。因此,我在文献引用方面做到详尽全面,预先致歉。希望未来再次讲授课程时,我能充分补充相关引用。尽管目前再次开课计划。

专知便捷查看,访问下面网址或点击最底端“阅读原文”

https://www.zhuanzhi.ai/vip/f084ff84babccd8042f8829752d046fa

图片

点击“阅读原文”,查看下载本文

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/181954