Py学习  »  机器学习算法

学习机器学习,究竟是理论重要,还是公式推导重要?

图灵教育 • 2 年前 • 267 次点击  
随着近几年机器学习的火爆,其从业门槛也越来越高,以至于出现面试者需要现场手推对数几率回归和手写反向传播代码的情况。不论是对机器学习本身的研究,还是岗位的需求,都需要我们对算法有很深的了解,对公式本质有很清晰的认知。因此,公式推导的重要性不言而喻。在了解底层原理的同时,具备代码实现的能力,才可以成为一位“造轮子大师”。
以应用层面来说,应该知晓用法,各模型的特点,适用于解决什么样的问题和实践技巧等。但是,不论是想要潜心研究自己的研究方向,抑或是想更加清楚的理解算法细节,公式推导都是非常重要的。
公式推导对机器学习的理解和应用有以下几点帮助:

1. 能够提升对算法的理解。在大部分的有关机器学习内容的书籍中,对于算法的细节是不会有很多涉及的,因此基于书的理解,有可能写出的代码无法实现功能,因此公式的推导是非常重要的。只有真正理解了公式,才能正确的写出代码,并实现功能。

2. 能够从根本上解决算法出现问题时不知所措的情况。并非所有的算法都是完全正确的,在部分算法的实现中,会出现各种各样的问题,对于不了解机理的同学来说,就很难解决实际发生的问题,因此公式推导可以帮助你了解算法的初始化,保证矩阵正定,解决 overflow 问题等。

3. 加深算法间的联系,构建自己的算法思路脉络。机器学习的算法有很多种,如果不能通过对算法的了解,建立自己的算法思路脉络,就会出现无法应用最佳算法实现的情况。

公式虽然是算法中很细节的部分,但是公式对于阅读代码,以及深入研究都有非常巨大的帮助,是不可忽视的。



有的小伙伴可能会有这样的疑问,在学习机器学习的过程中,究竟是理论重要,还是公式推导重要呢?

这两者其实是不冲突的,不论是公式推导抑或是基础理论的学习,都是为了能够更好的理解模型,为应用和研究而服务的。如果你的理论功底很强,但是在遇到实际问题时经常无从下手,那么公式推导会帮助你从细节处发现问题;如果你对公式推导非常熟悉,或者推导过机器学习中模型的公式,那你的理论基础同样会非常扎实。因此,这两部分其实是相辅相成的,不存在哪部分更重要。

如果你想多学习一下公式推导的话,那我们这本《机器学习:公式推导与代码实现》是你最好的选择。

这本书由“机器学习实验室”公众号主理人倾力奉献,历经 15 个月打磨,深入浅出地讲解了公式和代码设置,可读性非常强。
下面我们走进一下这本书,以监督学习的单模型和集成模型为例,来看看书中公式推导与代码实现的过程:

(书中“监督学习模型”的思维导图)

(书中体现“公式推导”“代码实现”的案例展示)


ji
qi
xue
xi

作者:鲁伟



图书特色

“机器学习实验室”公众号主理人倾力打造,获得 40000 读者好评
完备的公式推导,解决机器学习中的数学难题
基于 NumPy 与 sklearn,介绍 26 个主流机器学习算法的实现



PANTTWO
内容简介

作为一门应用型学科,机器学习植根于数学理论,落地于代码实现。这就意味着,掌握公式推导和代码编写,方能更加深入地理解机器学习算法的内在逻辑和运行机制。本书在对全部机器学习算法进行分类梳理的基础之上,分别对监督学习单模型、监督学习集成模型、无监督学习模型、概率模型四个大类共 26 个经典算法进行了细致的公式推导和代码实现,旨在帮助机器学习学习者和研究者完整地掌握算法细节、实现方法以及内在逻辑。




作者简介:

鲁伟
贝叶斯统计方向硕士毕业,深度学习算法工程师,主要从事医疗数据分析、医学图像处理和深度学习应用相关研究与工作。著有《深度学习笔记》一书,也是公众号“机器学习实验室”的主理人


大佬推荐
对于机器学习相关专业的研究者和从业者而言,运用机器学习处理数据要有两大基本功,一个是理论功底,另一个是算法实现能力。这本书正好契合这两大主题:以公式推导为代表的机器学习理论体系和以 NumPy 算法实现为代表的编程能力。全书体现了两个非常有特色的对应关系:公式推导与 NumPy 代码实现之间的对应关系,NumPy 代码实现与 sklearn 机器学习库之间的对应关系。此书编排新颖,非常值得一读!
——汤银才,华东师范大学统计学院教授
在机器学习流行的这些年,很多人停留在使用 sklearn 调包的阶段,对模型背后的数学原理和算法实现一知半解,因而很难提升到更高的水平。书中详细的数学推导、用 NumPy 从零开始的编程实现,一定会让读者知其然,还知其所以然,对机器学习模型会有更深刻的认识。
——王圣元,新加坡某金融咨询公司总监,公众号“王的机器”主理人
很早就关注鲁伟老师公众号的“数学推导+纯Python实现机器学习算法”系列文章,这给了我很大启发。市面上的机器学习图书很多,但很少有结合数学原理和代码实现的。这本书几乎涵盖了全部主流的机器学习算法,而且使用Python代码进行算法的实现。这本书对初学者相当友好,理论、代码齐备,值得推荐。
——黄海广,温州大学副教授、人工智能系主任
Datawhale出版过一本“南瓜书”,作为“西瓜书”的伴侣书,聚焦于机器学习公式的详细推导,旨在解决初学者入门机器学习中的数学难题。而这本书在公式推导的基础上,进一步给出了包含算法内在逻辑的代码实现,是初学者动手实践算法不可或缺的材料,推荐给大家!
——范晶晶,开源组织 Datawhale 创始人
这本书既有复杂的公式推导,可以帮助读者掌握算法的数学原理;也有NumPy库版本的算法代码,可以帮助读者更好地理解其中的数学原理,提高算法实现能力;还有sklearn库版本的算法调用函数,可以帮助读者快速、简单地实现算法。这本书由浅入深,适合新手快速入门,也适合老手夯实基础,在此极力推荐给诸位!
——张杰,公众号“EasyShu”联合主创,《Python数据可视化之美》作者
很多人初学机器学习时,只是调个包跑个结果,这种方式很容易忽略各类机器学习算法的底层原理,不是最佳的学习方式。这本书在手推公式和基本不调用机器学习算法库的前提下,“手撕”各大机器学习算法,给大家提供了学习机器学习最硬核的方式,有助于加深对各大机器学习算法底层原理的理解。整本书全面又细致,非常适合初学者打基础,强烈推荐给大家!

——张金雷,北京交通大学交通运输学院讲师,公众号“当交通遇上机器学习”主理人


好了,这本书的介绍就到这里了。
下面有个好消息要告诉大家!在京东计算机销量排行榜中《机器学习:公式推导与代码实现》获得了第 1 名的好成绩,而且京东限时 5 折,今天就截止了,感兴趣的小伙伴一定不要错过这波优惠和这本好书呀!




赠书活动
留言上墙
那大家认为在学习机器学习的过程中,理论和公式推导哪个重要呢?欢迎评论区留言,我们将选择 1 位送出《机器学习:公式推导与代码实现》1 本,截止时间 2 月 7 日。

限时 5 折,了解详情☟
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/126507
 
267 次点击