Py学习  »  机器学习算法

免费资源!数据科学及机器学习必备书单下载!(理论&应用)

数据分析 • 5 年前 • 411 次点击  

作者:Trung Nguyen 翻译:王雨桐 校对:张一豪

本文1000字,建议阅读5分钟

本文将分理论部分和实际部分为你推荐一些机器学习和数据科学的相关书籍。

 

公众号主界面回复书单获取本文推荐书籍下载链接


理论部分


以下都是机器学习的基础教材。如果你认真研读其中任意一本,这意味着你要分析其中的模型,推导和实现主推理算法并进行练习,这些教材可以为你提供坚实的背景。如果你是机器学习的入门菜鸟,这些书可能技术性很强,但是一旦你坚持完成其中一本,你会发现其他教材也变得简单易懂。

 

1. 统计学习精要(The Elements of Statistical Learning (ESL))



作者:Jerome H. Friedman, Robert Tibshirani, and Trevor Hastie

推荐语:经典之作!!这同时也是一个在线课程,新版教材提供R代码

 

2. 模式识别与机器学习(Pattern recognition and machine learning (PRML))



作者:Christopher Bishop

推荐语:和ESL一样,这本也是必读之作。

 

3. 机器学习:概率学观点(Machine Learning: A Probabilistic Perspective)



作者:Kevin R Murphy

推荐语:如果你彻底学习(前文)PRML,你能掌握这本书中的大部分内容。 然而,这是一本有趣而全面的书,主要关注有原则的、概率性的建模方法。 它还附带Matlab中的代码。

 

4. 概率图模型(Probabilistic Graphical Models)



作者:Daphne Koller and Nir Friedman

推荐语:图模型为概率模型的表示、推理以及学习提供了框架。这个强大的框架为许多机器学习模型提供了宏观视角,否则这些模型仅仅被看作一堆不同的模型。书还配有Coursera的在线课程。


5. 强化学习(Reinforcement learning, an introduction)



作者:Richard S. Sutto and Andrew G. Barto

推荐语:尽管这本书还是一个初稿,但第二个版本已经写得很好,并且很好地解释了强化学习的概念和应用。

 

6. 神经网络与深度学习(Neural networks and deep learning)



作者:Michael Nielsen

推荐语:Michael Nielsen的书更加实用,包含一些很酷的互动内容以帮助理解


7. 深度学习(Deep Learning)



作者:Ian Goodfellow and Yoshua Bengio and Aaron Courville

推荐语: 相比上面Michael Nielsen书的实用性,本书则更全面。我建议按照给定的顺序阅读学习。

 

应用部分


1. 商业中的数据科学(Data science for business)



作者:Foster Provost and Tom Fawcett

推荐语:本书对非技术人员(如业务经理)非常友好。它还提供了有关如何执行数据科学项目的一些合理原则。强烈推荐此书!!

 

2. R数据科学(R for data science)



作者:Garrett Grolemund and Hadley Wickham

推荐语:特别是对R用户来说,这本是必读教材。

 

3. 应用预测建模(Applied predictive modelling)



作者:Kjell Johnson and Max Kuhn

推荐语:由非常流行的R包caret的作者撰写,也是一本必读教材。 它包含许多实用技巧和建议,不仅可用于建模,还可用于不同模型的数据准备。

 

4. 数据科学技术:市场营销、销售与客户关系管理领域(Mining Techniques: For Marketing, Sales, and Customer Relationship)



作者:Gordon S. Linoff and Michael J. A. Berry

推荐语:不要被标题误导,书中的数据科学技术普遍适用,不仅仅是对客户关系管理(CRM)。

 

5. 数据挖掘的数据准备(Data preparation for data mining)



作者:Dorian Pyle

推荐语:1999年出版,但今天仍然非常适用,本书提供了一个明细的清单,以便在准备分析数据时进行检查。

 

6. 网站优化的Bandit 算法(Bandit algorithms for website optimization)



作者:John Myles White

推荐语:本书介绍了标准的多臂赌博机算法(multi-armed bandit),并提供了多种语言的实现。

 

7. R数据科学实战手册(Practical data science with R)



作者:John Mount and Nina Zumel

推荐语:此书不像Johnson和Kuhn的书那样精致,但还是有一些值得了解的技巧。


公众号主界面回复‘14’获取本文推荐书籍下载链接


原文标题:

Data science books - theory and practice

原文链接:

https://www.codementor.io/trungnguyen958/data-science-books-theory-and-practice-krrjgncy7

译者简介:王雨桐,统计学在读,数据科学硕士预备,跑步不停,弹琴不止。梦想把数据可视化当作艺术,目前日常是摸着下巴看机器学习。

「完」


转自:数据派THU ;

版权声明:本号内容部分来自互联网,转载请注明原文链接和作者,如有侵权或出处有误请和我们联系。

关联阅读

原创系列文章:

1:从0开始搭建自己的数据运营指标体系(概括篇)

2 :从0开始搭建自己的数据运营指标体系(定位篇)

3 :从0开始搭建自己的数据运营体系(业务理解篇)

4 :数据指标的构建流程与逻辑

5 :系列 :从数据指标到数据运营指标体系

6:   实战 :为自己的公号搭建一个数据运营指标体系

7:  从0开始搭建自己的数据运营指标体系(运营活动分析)

8:上班一周了,【就业季】对2018年交满意的答卷...

数据运营 关联文章阅读:  

运营入门,从0到1搭建数据分析知识体系    

推荐 :数据分析师与运营协作的9个好习惯

干货 :手把手教你搭建数据化用户运营体系

推荐 :最用心的运营数据指标解读

干货 : 如何构建数据运营指标体系

从零开始,构建数据化运营体系

干货 :解读产品、运营和数据三个基友关系

干货 :从0到1搭建数据运营体系

数据分析、数据产品 关联文章阅读:

干货 :数据分析团队的搭建和思考

关于用户画像那些事,看这一文章就够了

数据分析师必需具备的10种分析思维。

如何构建大数据层级体系,看这一文章就够了

干货 : 聚焦于用户行为分析的数据产品

80%的运营注定了打杂?因为你没有搭建出一套有效的用户运营体系

从底层到应用,那些数据人的必备技能

读懂用户运营体系:用户分层和分群

做运营必须掌握的数据分析思维,你还敢说不会做数据分析

合作请加qq:365242293  


更多相关知识请回复:“ 月光宝盒 ”;

数据分析(ID : ecshujufenxi )互联网科技与数据圈自己的微信,也是WeMedia自媒体联盟成员之一,WeMedia联盟覆盖5000万人群。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/30066
 
411 次点击