大家好,我是章北海
我正在撰写《机器学习算法与Python实战》专栏,分为基础篇、数学篇、模型篇、实战篇。
最近我把数学篇的三章内容整理了一下,做成了这个116页的PDF小册子。
小册子一共三个章节,介绍了机器学习中的概率论、统计学、线性代数知识点,以下是章节简介及内容大纲:
概率论知识在机器学习中十分重要,但是学习起来却有些困难。难点是:不知道需要学多少,学多深。经典如斯坦福大学CS 229 机器学习课程的概率论预备知识要求非常广泛,而Coursera上有一门《机器学习概率与统计》课程,讲的事无巨细,学完需要23个小时。《机器学习中的概率论》这一章,我参考2023年斯坦福大学CS229课程中的概率论预备知识,不过简,也不过繁,尽可能把机器学习所需的概率知识介绍完整,并附带代码示例。
机器学习基于统计的框架,因为机器学习涉及数据,而数据必须基于统计学框架来进行描述。李航老师的经典机器学习教材第一版名字就叫《统计学习方法》,可见机器学习与统计学的关系多紧密。统计学有着庞大的知识体系,绝大部分对理解机器学习相关概念毫无益处,反而会让人更加迷惑。《机器学习中的统计学》一章,我仅介绍与机器学习强关联的统计学知识点,配以代码辅助理解。
无论怎么形容线性代数在机器学习中的重要性都不为过,尤其是矩阵的运算,能够有效地处理高维数据、提取特征、优化模型参数,并实现复杂的数据变换和预测任务。《机器学习中的线性代数》这一章,我重点参考了斯坦福大学CS229中对线性代数的备用知识框架的理论部分,还参考了《The Art of Linear Algebra》中对麻省理工大学Gilbert Strang教授经典线代教材《Linear Algebra for Everyone》中矩阵的可视化理解,另外添加了诸多Python代码辅助理解重点概念。
116页PDF小册子获取方式: