社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

零基础学习Python数据挖掘

马哥Linux运维 • 8 年前 • 652 次点击  

作者:聊聊数据分析和挖掘

https://www.zhuanlan.zhihu.com/p/25575805

Python已经稳坐机器学习的第一语言(机器学习编程语言之争,Python夺魁),尤其是深度学习框架Torch宣布支持Python之后。所以学习Python进行数据挖掘是性价比是最高的(本人也放弃了使用了3年多的R语言)。而使用Python进行数据挖掘是最近几年才开始火起来的,之前网上很多的资料都是关于Python网页开发等。但使用Python进行数据挖掘的侧重点已经完全不一样了。本人就是浪费了很多时间来筛选这些博客、书籍。所以就有了本文,希望能帮大家少走一点弯路。

本文章主要从数据挖掘的角度出发,谈谈如何入门数据挖掘。本文不能保证你能成为大神,但是如果能踏踏实实地学习完,找一份年薪15w+的工作还是不太难的,考虑到市场上人才的稀缺。本人也是非计算机专业,所以希望给非计算机的人一点参考。现在市场上数据挖掘的人才非常缺少,现在大一点的企业都需要数据分析、数据挖掘的人才,但是国目前只有3所大学开设了相关的本科专业,计算机专业的人也不会抢这饭碗,因而,造成了数据挖掘市场上人才的供给不足,所以给了一大堆非科班出身人很多的机会。


一、Python 基础语法学习


如果只推荐一本书,强烈推荐《跟老齐学Python》,Python中的核心概念做了非常棒的讲解,深刻而不失幽默。

如果想系统的学习推荐密歇根大学的《学习使用Python编程并分析数据》系列课程。

廖雪峰Python教程 简单易上手的Python基础语法教程,值得学习, Python 2和Python 3版本都有。


二、 机器学习理论


基本经典的机器学习书籍

机器学习入门(中/英)(谷歌大牛的课程)

机器学习(乔治亚理工大学计算机课程)

周志华的西瓜书《机器学习》

深入一些的可以考虑李航的《统计学习方法》

还有偏统计的斯坦福的教授写的《统计学习导论》,深入版本的《The Elements of Statistical Learning》(英文影印版)

上面推荐的都是非常不错机器学习的入门书籍,都是经典了。


三、Python机器学习代码学习


掌握Python语法的基础上学习《Python for data analysis》是比较不错的选择,涵盖了ipython notebook、Numpy、Scipy和Pandas包的使用。

《Python数据分析与挖掘实战》介绍了使用Python进行数据挖掘的详细案例,数据和代码都可以下载,作为机器学习的进阶学习是不错的选择(这本书也用对应的R语言和Matlab 版本)。

还有Udacity机器学习纳米学位项目代码(Github上有)

再推荐2本国外网站的书籍,还在early release阶段《Python Data Science Handbook》和《Hands On Machine Learning with Scikit-Learn and TensorFlow》,非常好的代码示范。注册Safari Online,可以免费看10天。


四、优秀博客和微信公众号


我推荐的网站和微信公众号都是我平时天天看的,那些水货大多被我取消关注了,养成每周清理公众号的好习惯。

1. 数据挖掘入门与实战 全是干货,代码质量非常高。

2. 机器学习研究会 我校老师组织的学习平台,代码加行业信息齐飞,质量非常高。尤其是我校的AI公开课(有直播),中国顶尖人工智能大腕云集。

3. 新智元 人工智能方向行业观点,对于自己把握技术方向非常重要,比如说自动驾驶这个坑能不能入?

4. 机器之心 技术前沿与重量级新闻。

还有一些其他的,下次再继续补充。

还有几个博客:

iPhone上可以使用Reeder阅读器,Instapaper用来保存后稍后阅读,因为信息量比较大。

No free Hunch Kaggle竞赛平台的官方博客,包括一些优秀的代码解读以及高分选手的采访,十分有用的经验(来自不同背景,不同年龄层次,不同职业的选手)

Analytics Community | Analytics Discussions | Big Data Discussion 干货技术文章

新浪微博-爱可可 (北邮PRIS模式识别实验室陈老师)


五、计算机书籍下载网站


再添加几个外文书籍下载网址:

1. All IT eBooks 全,可能需要使用翻*墙下载,翻*墙方法见文末

2. Library Genesis 各种书籍,不局限于编程书籍

3. Fox eBook - eBooks Free Download Site

4. Development / Programming / AvaxHome



——马哥教育,理论与实战并重——

——让你懂,更让你行——


课程优惠信息请扫码

学员限量招募
长按识别二维码,立刻联系红豆


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/weixin/uksi0jAE9j
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/1983
 
652 次点击