Py学习  »  机器学习算法

机器学习入门资料推荐(Python爱好者社区&机械工业出版社送书活动)

Python爱好者社区 • 6 年前 • 559 次点击  


机器学习和人工智能无疑是当下最热门和最有“钱途”的行业。作为一个从来没接触过复杂算法,数学也基本还给老师,长期实现增删改查业务逻辑的码农,如何进入机器学习领域呢?本文试图理清一条高效地进入机器学习大门的路径。

编程语言

机器学习和数据挖掘应用比较广泛的编程语言有 Matlab, R 语言和 Python ,在此笔者强烈推荐 Python。主要是基于以下几个原因:

1. Python 应用范围更广。不单单在机器学习,在网站后台开发,自动化运维,网络爬虫等方面都有非常广泛的应用。学习一门语言可以在不同的领域使用,无疑会提高投入产出比。


2. Python 开发社区活跃。截止到 2018 年 3 月份,Python 语言在 TIOBE 编程语言排行版上已经上升到第 4 位。网络上有大量的开源组件可供使用,可大大提高开发的效率。


3. Python 的机器学习框架丰富。几乎所有的热门机器学习框架,从 scikit-learn 到 keras,再到 tensorflow,无一例外。


4. Python 语言更优美。人生苦短,我用 Python。这是作为 Python 程序员常挂在嘴边的一句话。


在此,笔者无意挑起语言之争,每种语言都有自己的适用范围和应用场景。读者诸君大可把笔者的结论当作一个参考,选择一个适合自己的机器学习编程语言。假设,睿智如你,选择了 Python 作为编程语言,有没有 Python 语言入门的书籍推荐呢?毫无疑问《Learn Python the Hard Way》,中文翻译《笨办法学 Python》,是不二的选择。

数学基础

数学对机器学习的重要性不言而喻。所有的机器学习算法模型的核心原理,都是基于数学之上构建的。机器学习涉及到的数学有:线性代数,概率论和统计学,信息论,数学分析,最优化等。数学是最深不见底的学科,如果是以发论文为出发点,那么坚实的数学基础是必不可少的。另外,如果你想从事基础性研究,作为数值计算科学家,实现并优化机器学习算法,那么对数学的要求也是非常高的。但如果在工程应用领域应用机器学习算法解决工程问题,那么入门级别的数学知识就足够了。大家可以搜索“机器学习数学基础”,找一些视频教程来学习。

此外,有些机器学习入门的书籍,也会详细介绍算法涉及到的数学知识,这对数学基础较弱的小伙伴是个非常实用的内容。所以,对那些数学基础确实比较薄弱的小伙伴,笔者不建议一开头就淹没在数学的海洋里,对大部分人来说,学习数学是比较枯燥的,这一过程如果持续时间太长,非常容易打击学习的积极性,造成挫败感。一个曲线救国的方法是,先找一本较少涉及艰深数学的机器学习入门书籍,先从侧面切入。随着机器学习的深入,在需要用到艰深的数学时,再各个击破。

机器学习

有了一定的数学基础,就可以切入机器学习了。谈到机器学习入门教程,几乎所有人都会推荐 Coursera 上 Andrew Ng 的《机器学习》这个视频教程。这门课程的封面图片几乎已经成为了机器学习的图腾了。

此外,笔者推荐另外一本书《scikit-learn机器学习:常用算法原理及编程实战》。这本书的最大特点是,较少的涉及艰深的数学知识,对涉及到的数学知识,都有通俗的语言解释以及图片可视化讲解,比较适合数学基础较弱的初学者。此外,这本书以 Python 语言为基础,以 scikit-learn 为机器学习框架,介绍了 Python 数据分析及可视化的库,如 numpy, pandas, matplotlib,还介绍了线性回归,逻辑回归,支持向量机,决策树,朴素贝叶斯等常用算法,是一本较适合初学者的书籍。

此外,李航老师的《统计学习方法》是一本不可多得的好书。《The Elements of Statistical Learning》是一本大部头硬书,同时也是好书,推荐感兴趣的读者阅读。

竞赛

入门了机器学习后,就可以通过以赛促学,以学促赛的模式来不断地提高自己的综合能力。比较著名的机器学习算法竞赛平台有国内的阿里天池平台,国外的 kaggle 平台。首先,这些竞赛平台都提供了非常规范的,真实的工业级的数据集来给我们训练。其次,这些平台往往高手云集,非常特别愿意分享,特别是 kaggle 平台上,很多人都愿意把自己的代码开源,让初学者学习。这是入门到提高的一个非常重要的一节。设想一下,你在 kaggle 上混到五颗星,这本身就是一个牛气冲天的简历了。

大数据平台

机器学习竞赛上的数据都是提前整理好的格式化的数据。而在工程应用领域,往往需要自己从数据库里提取出原始的数据库进行分析处理,最终生成算法模型可用的数据集。所以,如果你熟悉 spark/hadoop 等大数据平台,对找工作无疑是个非常大的加分项。这个时候可以留意一些招聘网站上,大公司对机器学习工程师的岗位要求,有针对性地查缺补漏。

留言送书

Python爱好者社区携手机械工业出版社发起新一轮送书活动!!!大家可以留言讨论:机器学习有哪些应用场景?为什么你想要学习机器学习?还有哪些好的机器学习资源推荐?截止到2018.4.3 17:00,点赞排名前五的小伙伴,将送出由机械工业出版社出版的《scikit-learn机器学习:常用算法原理及编程实战》一本。如果你有本事用抖机灵的评论入选点赞前五,小编也敢照样送出这本书。

土豪朋友或者参加活动没get到的送书的朋友要购买此书也有方法哦

点击阅读原文即可购买本书

Python爱好者社区历史文章大合集

Python爱好者社区历史文章列表(每周append更新一次)

福利:文末扫码立刻关注公众号,“Python爱好者社区”开始学习Python课程

关注后在公众号内回复课程即可获取

小编的Python入门视频课程!!!

崔老师爬虫实战案例免费学习视频。

丘老师数据科学入门指导免费学习视频。

陈老师数据分析报告制作免费学习视频。

玩转大数据分析!Spark2.X+Python 精华实战课程免费学习视频。

丘老师Python网络爬虫实战免费学习视频。




点击
阅读原文
,即可在京东购买本书!


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/9872
 
559 次点击