Py学习  »  Python

《Python 极简讲义:一本书入门数据分析与机器学习》书评

少吹牛多讀書 • 3 年前 • 434 次点击  

  • 前言

  • Python 基础部分

  • 数据分析部分

  • 总结

前言

苦战一个月,每天平均 2 小时终于搞定《Python 极简讲义:一本书入门数据分析与机器学习》一书。这本书豆瓣上评价[1]很高:

读后感觉实至名归,配得上 9.2 的评分,和 《Python 数据科学手册》 相比有过之而无不及。总体而言,思路更加清晰,遵循书中前言所提到的“最少必要知识(Minimal Actionable Knowledge and Experience, MAKE)”,这一理念,更适合入门。

本书共分三大部分,Python 基础、数据分析、机器学习:

第 1 章至第 5 章以极简方式讲解了 Python 的常用语法和使用技巧,包括数据类型与程序控制结构、 自建 Python 模块与第三方模块、Python 函数和面向对象程序设计等。第 6 章至第 8 章介绍了数据分析必备技能,如 NumPy、Pandas 和 Matplotlib。第 9 章和第 10 章主要介绍了机器学习的基本概念和机器学习框架 skleam 的基本用法。

全书近 600 页,我事实上只看了 Python 基础和数据分析部分,机器学习部分暂时没有涉及。不过这两部分其实是书的主要内容,占了绝大部分的篇幅(460 页)。

Python 基础部分

这部分花了近 200 页的篇幅,分为开发环境(Jupyter)、数据类型和程序控制结构、模块、函数、面向对象等高级特性几部分,写的非常精辟。

不过这部分并不适合零基础的读者直接学习,但是假如之前学过 《python 编程从入门到实践》 这样的 Python 基础类的书籍。这部分内容将是检验学习成果的好材料,即如果你能比较轻松看懂这部分并完成每章后面的习题,那么你的 Python 基础算过关了,可以放心学习后面的内容。

当然高级特性部分(比如面向对象)事实上比较难,书中也没写得非常清楚,稍微了解即可。毕竟,如果目标是数据分析,大多时候是还是写面向过程的代码。你不懂这些内容,但并不影响你解决问题,顶多就是实现方式不够优雅而已。

数据分析部分

依然是介绍经典的三件套,Numpy、Pandas 和 Matplotlib。之所说这书观感比《Python 数据科学手册》好,就是因为这部分的介绍详略得当,逻辑清晰,而 《Python 数据科学手册》 一书有种烂尾的感觉。下面谈一下这部分的亮点:

  • numpy 部分介绍的 einsum 方法灵活强大值得了解。
  • Pandas 部分介绍详略得当,比较到位,该有的都有。又不至于让读者陷入过多复杂的知识,而望洋兴叹。
  • 可视化部分,最后介绍了 Pandas 中直接绘图,以及用 Seaborn 绘图。意义比较大,因为 Matplotlib 要绘制精美的图片事实上比较麻烦。而这两种方式,有时候更加便捷高效。

总结

虽然总体非常不错,但是仍有不足。比如在 Pandas 读取数据方面只演示了 csv 文件的读取。另外,书中有些地方有知识性的错误,如:

loc、iloc 是属性而不是方法。还有一些示例代码写得太过复杂,事实上可以写得更加简单 

“尽信书不如无书”,学代码还是要多动手多实践,多去解决实际问题。要不然很多知识就是孤立的点,只要多动手解决问题,才能让这些知识“活”起来。

在解决完这本书后,自我感觉 Python 基础已经比较牢固,建立了相对完善的知识体系。可以开始动手解决实际问题,在实践中学习 

毕竟知识是学不完的,真想要精通 Numpy、Pandas 就得先学个几年。人生苦短,MAKE 比较实在。要不然别人都在搞机器学习了,你还在 Pandas 中苦苦挣扎 

参考资料

[1]

豆瓣上评价: https://book.douban.com/subject/35044749/


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/149325