Py学习  »  机器学习算法

知乎热议:如何学习机器学习

连享会 • 1 年前 • 201 次点击  

👇 连享会 · 推文导航 | www.lianxh.cn

连享会课程 · 基于机器学习的因果推断方法

作者:仵荣鑫 (厦门大学)
邮箱:rxwu_cn@163.com

编者按:机器学习作为人工智能的重要分支,受到人们的广泛关注。机器学习是一门多领域交叉学科,掌握机器学习技术是一项重要且充满挑战的任务。为此,编者梳理了知乎答主们对机器学习的建议。

温馨提示: 文中链接在微信中无法生效。请点击底部「阅读原文」。或直接长按/扫描如下二维码,直达原文:


目录

  • 1. 技能准备

  • 2. 入门学习

  • 3. 进阶提升

  • 4. 深度学习

  • 5. 学习建议

  • 6. 相关推文



1. 技能准备

刚开始接触机器学习,需要做一些必要的技能储备,过三关:英语、编程与数学。首先,英语需要具备阅读与听力能力。当前主流的书籍、期刊等资料大多是英文为主,我们无法避免地要看很多英文资料。

其次,关于编程语言,首推 Python,因为其良好的拓展支持性,主流的工具包都有 Python 版本。在特定情况下,选择 R 作为编程语言也是可以的。编程语言学习推荐:

  • Programming for Everybody: Python
  • Learn R with R tutorials and coding challenges: R

最后,数学包括微积分、线性代数与统计学,可通过教育性非营利组织「可汗学院」学习。数学建议先搞定线性代数,推荐以下课程:

  • 斯特朗教授的课程由浅入深,环环相扣:完整版-麻省理工-线性代数-全34讲+配套教材
  • 配合斯特朗教授的其他课程学习,效果事半功倍:MIT《数据分析、信号处理和机器学习中的矩阵方法》课程

统计学习是机器学习的基石,推荐以下课程:

  • Stanford : Statistical Learning 斯坦福大学:统计学习

2. 入门学习

刚迈入机器学习的大门,需要有适合的学习途径:视频、书籍与动手。机器学习视频入门首选:

  • Machine Learning by Andrew Ng

吴恩达老师的这门课可以加快学习进度,但不要跳过练习题,练习题非常有价值,虽然并非用 Python 写的 (而是 Matlab/Octave)。如果你不想学 Matlab,那么最好找点别的用 Python 习题练练手。当然,以下课程也非常不错:

  • 李宏毅 2021/2022春-机器学习课程

在学习视频时,推荐阅读两本非常好的入门书籍:

  • Python 机器学习 (作者 Sebastian Raschka):阅读本书可以快速对如何使用 Python 机器学习框架 Sklearn 有一个基本的了解,可以很快上手开始工作;
  • An Introduction to Statistical Learning with R (ISL):ISL 是 The Element of Statistical Learning (ESL) 的入门版,不仅大量去除了繁复的数学推导,还加入了 R 编程的部分,方便大家可以尽快上手。

入门书籍推荐还强推:

  • 周志华老师的《机器学习》:人称西瓜书,是经典入门教材之一,是一本大而全的书!内容中有用到西瓜举例子。建议和《南瓜书》一起看;
  • 李航老师的《统计学习方法》:这本书对机器学习原理的解释、公式的推导非常详尽,相信看完这本书,不会再说机器学习是玄学了。建议配合「白板推导系列」学习。

学习理论后,做一些基于 Python 的动手练习:

  • Python 教程-廖雪峰的官方网站:教程质量很好,没有必要全看完,大概了解 Python 的基础语法即可,这步是为下面的练习做准备;
  • 《机器学习实战》(作者 Peter Harrington):这本书基于 Python 对一些主要的机器学习算法进行了代码实现。一定要照着敲一遍。

3. 进阶提升

实战热身:

  • 《利用 Python 进行数据分析》(作者 Wes McKinney)numpypandas 是 Python 进行处理数据的两个关键库,这本书讲解了这两个库的使用方法;
  • scikit-learn: machine learning in Python 是 Python 上最流行的机器学习/数据科学工具包。比较推荐的方法是把主流机器学习模型 Sklearn 中的例子都看一遍。Sklearn 的文档不仅提供了练习数据、sklearn 的相关代码实例,还提供了可视化图;
  • 机器学习实战:基于 Scikit-Learn 和 TensorFlow:为数不多的把理论和实践相结合的比较棒的书,尤其是代码部分!

实战平台:

  • kaggle:Your Home for Data Science;
  • 推荐一篇不错的文章:Kaggle 入门,看这一篇就够了
  • 如果是新手,建议把 Titanic 项目玩一次:Titanic-Machine Learning from Disaster
  • 阿里云天池:天池大数据众智平台-数据科学家社区。

4. 深度学习

深度学习推荐以下视频课程:

  • 李宏毅:深度学习 (2017)
  • 吴恩达:深度学习课程,网易云课堂上线了这门课的中文版。

深度学习的几个大应用,自然语言处理、自然语言理解、深度视觉算法:

  • 自然语言处理:2019 最新斯坦福大学 CS224n 深度学习自然语言处理课程
  • 斯坦福大学 CS224U:自然语言理解 2019 最新课程
  • 斯坦福 CS231n 《深度视觉识别》课程 (2017)
  • 中科院宗成庆:自然语言处理公开课 (64 集)

深度学习的书籍推荐两本,一本理论性强的,一本实践性强的:

  • Deep Learning:由 Ian Goodfellow、Yoshua Bengio 和 Aaron Courville 三位大牛合著的非常权威的一本书,也是后来出版的深度学习书籍的参考;
  • 《动手学深度学习》:深度学习的交互式学习体验。书中不仅阐述深度学习的算法原理,还演示它们的实现和运行。

更多深度学习的干货:

  • 机器学习 (Machine Learning) 与深度学习 (Deep Learning) 资料汇总

5. 学习建议

自学机器学习的误区和陷阱:

  • 不要试图掌握所有的相关数学知识再开始学习机器;
  • 不要把深度学习作为入门第一课;
  • 不要收集过多的资料,要分辨资料的时效性。

将技能落在实处,防止练就一身屠龙之技。机器学习最大的幻觉就是觉得自己什么都懂了,但等到真的使用时发现并不奏效。如果此刻燃起了学习机器学习的热情,就请赶快行动!

6. 相关推文

Note:产生如下推文列表的 Stata 命令为:
lianxh 机器学习, m
安装最新版 lianxh 命令:
ssc install lianxh, replace

  • 专题:论文写作
    • Semantic scholar:一款基于机器学习的学术搜索引擎
  • 专题:Stata教程
    • Stata-Python交互-7:在Stata中实现机器学习-支持向量机
  • 专题:Python-R-Matlab
    • MLRtime:如何在 Stata 调用 R 的机器学习包?
  • 专题:其它
    • 知乎热议:机器学习在经济学的应用前景
  • 专题:机器学习
    • 机器学习在经济学领域的应用前景
    • 机器学习如何用?金融+能源经济学文献综述
    • 知乎热议:纠结-计量经济、时间序列和机器学习
    • 机器学习:随机森林算法的Stata实现
    • Stata:机器学习分类器大全

课程推荐:因果推断实用计量方法
主讲老师:邱嘉平教授
🍓 课程主页https://gitee.com/lianxh/YGqjp

New! Stata 搜索神器:lianxhsongbl  GIF 动图介绍
搜: 推文、数据分享、期刊论文、重现代码 ……
👉 安装:
. ssc install lianxh
. ssc install songbl
👉  使用:
. lianxh DID 倍分法
. songbl all

🍏 关于我们

  • 连享会 ( www.lianxh.cn,推文列表) 由中山大学连玉君老师团队创办,定期分享实证分析经验。
  • 直通车: 👉【百度一下: 连享会】即可直达连享会主页。亦可进一步添加 「知乎」,「b 站」,「面板数据」,「公开课」 等关键词细化搜索。


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/152795
 
201 次点击