Py学习  »  机器学习算法

程序员如何挑选图书?以图灵机器学习图书为例

图灵教育 • 5 年前 • 666 次点击  

以前资料太少,我们不知道怎么找资料;如今资料太多,我们变得不知道如何选资料......不过,图灵的读者小伙伴们肯定有不少挑选资料小能手,文末一定要分享你的小窍门。

在众多的资料中,图书永远是系统学习知识的首选(相信关注这个公众号的读者们也认同这句话)。那么,既然图灵君是卖书翁,今天咱们来小小地聊一下挑选图书这个问题,且以图灵的机器学习图书为例吧!

该怎么选一本适合自己的书呢?下面介绍的是几种最为常见和简单的方法(疑难和罕见方法留给小伙伴们去补充)。


一、口碑和销量

口碑方面,国内读者最方便的查询途径便是去豆瓣读书搜索一本图书,并查看综合评分和读者评论。个人认为,综合评分 7.0 以上的图书都或多或少具备某些不可忽略的特色,你好好研究研究是否跟自己的需求吻合即可。如果是原版书,美亚上的读者评价也是非常靠谱的。另外,一些深受读者喜爱的图书在知乎上也被广泛提及。销量方面,长居各大电商网站图书畅销榜单的图书,也是久经读者的火眼金睛考验的。

比如,在京东搜索 {机器学习},并且按照销量排序,得出的搜索结果如下:


看第一行,花书、西瓜书、图灵的《机器学习实战》是机器学习领域内最受关注的三本图书。至于具体要购买哪一本,还需要做更深入的比较,比如你个人的阅读需求、知识储备,图书本身的讲解风格,等等,都是非常关键的考量因素。花书固然经典,但是学术领域大佬的那种巨细靡遗海纳百川的风格也并非适合所有读者。说到底,不管是多么权威的作者写的书,多么权威的推荐者给出的推荐,之于你,都是备选和参考。明智的做法当然是从自身需求出发,去严肃认真地试读 1- 2章的内容,仔细查看图书目录,跟自己打算掌握的知识框架对比,这样才可能从琳琅满目的备选中取最适合当前自己需要的那一瓢饮。


《机器学习实战》是图灵最受读者欢迎的一本机器学习图书,也是机器学习领域的经典参考书。完全零基础的小伙伴阅读这本书会吃力,这本书的理论基础内容相对薄弱,涉及数学部分的知识也做到了尽量简单,它的特色是让你可以使用最基本的 Python 语法,通过实战快速上手机器学习,并能实现常见的应用,比如邮件过滤、数据分类等。


《Python机器学习基础教程》是图灵今年出版的非常受欢迎的 Python 机器学习入门书,这本书的特色依然是着重讨论机器学习算法的实践,涵盖在实践中实现机器学习算法的所有重要内容。


Machine Learning in Action

作者:Peter Harrington

译者:李锐 李鹏 曲亚东 王斌

定价:69.00元 / 电子书39.99元


  • 通过实战入门机器学习畅销经典

  • 介绍并实现机器学习的主流算法

  • 面向日常任务的高效实战内容

  • 可将数学矩阵描述的机器学习算法转化为可以实际工作的应用程序


全书通过精心编排的实例,切入日常工作任务,摒弃学术化语言,利用高效的可复用 Python 代码来阐释如何处理统计数据,进行数据分析及可视化。通过各种实例,读者可从中学会机器学习的核心算法,并能将其运用于一些策略性任务中,如分类、预测、推荐。另外,还可用它们来实现一些更高级的功能,如汇总和简化等。


《机器学习实战》豆瓣评论



二、系列图书

图灵日系 [ 图解X ] 技术入门书,因其文笔简练、深入浅出、多图表、形象生动的风格深得程序员喜爱。

大部分图解系列图书是可以零基础入门的,但是,这本《图解机器学习》不是。这本书在图灵的图解系列中也算是评分低的,我仔细阅读了给出差评的读者的意见,其中主要原因是无法零基础读懂,数学公式太多......那么,我在这里提到这本,也恰好是这个原因——它就是这本书的特色,另外,从 Matlab 实现代码上,也能体现这个特色。当然,另外一个很大的原因是图灵的图解系列整体上质量还是比较高的,还是希望小伙伴们在选择图书的时候优先考虑这个系列。

イラストで学ぶ 機械学習

作者:杉山将 

译者:许永伟

定价:49.00元


  • 187 张图轻松入门

  • 覆盖机器学习中最经典、用途最广的算法

  • 提供可执行的 Matlab 程序代码


本书用丰富的图示,从最小二乘法出发,对基于最小二乘法实现的各种机器学习算法进行了详细的介绍。第Ⅰ部分介绍了机器学习领域的概况;第Ⅱ部分和第Ⅲ部分分别介绍了各种有监督的回归算法和分类算法;第Ⅳ部分介绍了各种无监督学习算法;第Ⅴ部分介绍了机器学习领域中的新兴算法。书中大部分算法都有相应的 Matlab 程序源代码,可以用来进行简单的测试。


三、看作者背景

图灵的读者小伙伴虽然有不少学生,但实际上 90% 以上的小伙伴是要走向工业界的(猜的...),大概对学术界计算机科学家了解也没那么细致(猜的...)。不过,如果一本书的作者论文发了很多篇,写得好,而且引用次数非常多,那么按照常理来说,他写作的图书应该也不会差。比如这本《机器学习》,作者 Peter Flach 是布里斯托大学人工智能教授、Machine Learning 期刊主编,这本书原版在美亚的评分是 4.2 星。当然,工业界大厂核心团队推出的图书也是自带读者的,比如微软 Bing 核心团队成员推出的《机器学习系统设计》。

强调一遍《机器学习》这本书的特色,数学公式不少,各种算法(看英文标题:Machine Learning: The Art and Science of Algorithms that Make Sense of Data)。这本书是机器学习入门书,但有阅读难度,不过,一旦掌握就有柳暗花明的感觉。

Machine Learning: The Art and Science of Algorithms that Make Sense of Data

作者:Peter Flach

译者:段菲

定价:79.00元


  • 被誉为内容最全面的机器学习指南

  • 数百个精选实例和解说性插图

  • 汇集所有用于理解、挖掘和分析数据的先进方法


本书是迄今市面上内容最为全面的机器学习教材之一,书中汇集了所有用于理解、挖掘和分析数据的先进方法,并且通过数百个精选实例和解说性插图,直观而准确地阐释了这些方法背后的原理,内容涵盖了机器学习的构成要素和机器学习任务、逻辑模型、几何模型、统计模型,以及矩阵分解、ROC分析等时下热点话题。

Building Machine Learning Systems with Python

作者:Willi Richert,Luis Pedro Coelho

译者:刘峰

定价:49.00元 / 电子书19.99元


  • 微软 Bing 核心团队成员推出

  • 聚焦算法编写和编程方式

  • 结合大量实例学会解决实际问题


本书将向读者展示如何从原始数据中发现模式,首先从 Python 与机器学习的关系讲起,再介绍一些库,然后就开始基于数据集进行比较正式的项目开发了,涉及建模、推荐及改进,以及声音与图像处理。通过流行的开源库,我们可以掌握如何高效处理文本、图片和声音。同时,读者也能掌握如何评估、比较和选择适用的机器学习技术。


四、更多阅读需求直接转战出版商官网

有些读者的阅读需求既广又深,他们在选择图书上也有自己的一套成熟的做法,而且想在第一时间获取图书信息。如此,最为理想的信息源便是出版方官网或者社区了。

原版书爱好者可以去 https://www.safaribooksonline.com/ ,这里汇集了各大国外 IT 出版商的图书信息,或者去 O'Reilly 、Manning、Pearson 等的官网。

中文版图书一样的,比如到图灵社区搜索“机器学习” :


结果有 2 页,针对自己感兴趣的图书,点击相应的封面图片,进入图书主页。这个页面上,图书内容简介、作译者信息、目录、试读等,一应俱全。对了,在右边栏可以 购买电子书、兑换纸质样书、注册刮刮卡、提交勘误、下载源代码 等。


这里咱们挑选三本书介绍一下。

Introduction to Machine Learning with Python

《Python机器学习基础教程》

作者:Andreas C. Müller ,Sarah Guido

译者:张亮(hysic)

定价:79.00元 / 电子书39.99元

 

  • 使用 Python 和 scikit-learn 库一步一步构建一个有效的机器学习应用

  • 培养自己动手构建机器学习解决方案的能力

  • scikit-learn 库核心贡献者作品

 

本书主要内容包括:

  • 机器学习的基本概念及其应用;

  • 实践中最常用的机器学习算法以及这些算法的优缺点;

  • 在机器学习中待处理数据的呈现方式的重要性,以及应重点关注数据的哪些方面;

  • 模型评估和调参的高级方法,重点讲解交叉验证和网格搜索;

  • 管道的概念;

  • 如何将前面各章的方法应用到文本数据上,还介绍了一些文本特有的处理方法。 


Python Machine Learning Cookbook

《Python机器学习经典实例》

作者:Prateek Joshi
译者:陶俊杰,陈小莉
定价:59.00元


  • 来自 Kaggle 经典数据集和机器学习案例

  • 用流行的 Python 库 scikit-learn 解决机器学习问题

  • 帮你了解现实生活中机器学习的应用场景

  • 通过有趣的菜谱式教程教你掌握处理具体问题的算法

  • 监督学习技术、预测建模、无监督学习算法等前沿话题的实例代码展示


本书首先通过实用的案例介绍机器学习的基础知识,然后介绍一些稍微复杂的机器学习算法,例如支持向量机、极端随机森林、隐马尔可夫模型、条件随机场、深度神经网络,等等。通过本书,你不仅可以学会如何做出合理的决策,为自己选择合适的算法类型,而且可以学会如何高效地实现算法以获得最佳学习效果。


Mastering Machine Learning with R, Second Edition

《精通机器学习:基于R(第2版)》

作者:Cory Lesmeister

译者:陈光欣

定价:69.00元 / 电子书34.99元

 

  • 利用 R 包轻松应用机器学习方法 

  • 展示各类机器学习方法的优势与潜在问题 

  • 技术与理论并重,通过丰富的商业案例实现机器学习高级概念

  • 在 AWS 等云平台上利用 R 亲手实践机器学习

 

机器学习是近年来的热门技术话题,R 语言是处理其中大量数据的有力工具。

本书为读者提供机器学习和 R 语言的坚实算法基础和业务基础,内容包括机器学习基本概念、线性回归、逻辑回归和判别分析、线性模型的高级选择特性、K最近邻和支持向量机等,力图平衡实践中的技术和理论两方面。 



五、出版方书讯获取打包新书信息

出版方都有微信公众号等平台定期发布新书书讯。比如图灵,会在图灵社区、图灵教育微信公众号、微博等发布新书书讯,时间大约是每月月底发布下月的新书。

我们 4 月底发布的机器学习新书《机器学习:理论、实践与提高》,已经上架了。这本书是法国机器学习与算法经典参考书,畅销多年,知名计算机科学教授 Massih-Reza Amini 作品,机器学习专家 Francis Bach 作序推荐。另外,大家注意,这本书是 C 语言实现,真是在如今 Python 语言实现大潮中的一股倔强的小清流啊!


Apprentissage machine

《机器学习:理论、实践与提高》

作者:Massih-Reza Amini
译者:许鹏
定价:59.00元


  • 机器学习数学和理论知识必读书目

  • 教学与实践结合,提高机器算法技能

  • 机器学习专家 Francis Bach 作序

  • 讲解丰富案例,分析实践经验,阐释核心算法


从监督、半监督学习的基础理论开始,采用简单、流行的C语言,逐步介绍最常见、最先进的理论概念、算法与实践案例,呈现相应的经典算法和编程要点,满足读者想要了解机器学习运作模式的根本需求。

新书,展示一下目录和试读。

第1章 机器学习理论简述

1.1 经验误差最小化

1.2 经验风险最小化原理的一致性

1.3 依赖于数据的泛化误差界


第2章 无约束凸优化算法

2.1 梯度法

2.2 拟牛顿法

2.3 线搜索

2.4 共轭梯度法


第3章 二类分类

3.1 感知机

3.2 Adaline

3.3 Logistic回归

3.4 支持向量机

3.5 AdaBoost


第4章 多类分类

4.1 形式表述

4.2 单一法

4.3 组合二类分类算法的模型


第5章 半监督学习

5.1 无监督框架和基本假设

5.2 生成法

5.3 判别法

5.4 图法


第6章 排序学习

6.1 形式表述

6.2 方法

6.3 互相关数据的学习


附录 回顾和补充

附录A 概率论回顾

A.1 概率测度

A.2 条件概率

A.3 实随机变量


附录B 程序代码

B.1 数据结构

B.2 稀疏表示

B.3 程序运行

B.4 代码


长按到图灵社区试读


再啰嗦一下,众所周知,要想真正在机器学习领域深挖,过硬的数学基础那是必须的。

之前谷歌发布“机器学习速成课”的时候,图灵发过一篇:谷歌机器学习速成课学前预备书单,这个书单中包含了 3 本数学书(实际上是 6 本,程序员的数学是一套 3 本嘛),其中涵盖我们必需掌握的知识。


假设你对数学知识有更多学习要求,我们推荐这个书单:


然而,如果你只是想将机器学习代码服务于你的非人工智能项目,而且占比不多,就无须懂太多理论知识....这种情况下,《Python机器学习基础教程》《机器学习实战》这类图书足以应对工作要求。实际上,这是大部分程序员的诉求,也是大家偏爱这类图书,而不喜欢理论性太强、数学知识多的图书的最大原因。


END



赠书来了

好了,小伙伴们,我提到的几个方法都比较简单直接,你们肯定有很多一级棒的挑书方法是上面没提到的。留言说说你珍藏的小窍门,或者分享一下你最喜欢的图灵图书,不限于机器学习。


精选评论挑 3 人赠书,以上图书任选一, 5 月 24 日 14:00 截止




到京东购买《机器学习:理论、实践与提高》


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/60oeRwYEBg
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/12302
 
666 次点击