《Python数据分析》升级版第三期

梁斌 资深算法工程师
查尔斯特大学(Charles Sturt University)计算机博士,从事机器学习、计算机视觉及模式识别等相关方向的研究,在计算机视觉等国际会议及期刊发表10余篇学术论文。现就职于澳大利亚某科学研究机构(博士后),负责算法改进及其产品化、数据分析处理、建模及可视化。
近两年来,数据分析师的岗位需求非常大,90%的岗位技能需要掌握Python作为数据分析工具,本课程以案例驱动的方式讲解如何利用Python完成数据获取、处理、数据分析及可视化方面常用的数据分析方法与技巧。
1. 归纳总结实际项目中Python数据处理分析技巧
2. 新增统计分析的知识,帮助学员回顾相关知识
3. 强化数据可视化,提供数据展示的场景及案例
4. 强化机器学习原理并新增更多算法的介绍及演示
5. 新增文本分析中的主题模型(LDA)
6. 新增社交网络分析
7. 升级并调整全部随课项目
8. 每个项目均提供两套代码
(1) 包含项目详细步骤的Jupyter演示版代码
(2) 学员可以接触到真实项目的程序代码
9. 加大项目教学比例,让学员掌握关键项目步骤
10. 将相关章节的项目系统整理成一个完整项目
通过本课程的学习,学员将会收获:
1. 熟悉数据分析的流程,包括数据采集、处理、可视化、数据建模等
2. 掌握Python语言作为数据分析工具,从而有能力驾驭不同领域数据分析实践
3. 掌握非结构化数据的处理与分析
4. 快速积累多个业务领域数据分析项目经验,包括文本数据、图像数据及社交网络
5. 掌握使用Python实现基于机器学习及深度学习的数据分析和预测
6. 掌握数据分析中常用的建模知识
2017年10月11日,共9次,每次2~3小时
在线直播,共9次
第一课上课时间:10月11日 (晚20:00-22:00)
每周2次(周六、日,下午15:00 - 17:00)
直播后提供录制回放视频
可在线反复观看,有效期1年
第一课 工作环境准备及数据分析基础 (2-3课时)
1. 课程介绍
2. 工作环境准备
3. 数据分析中常用的Python技巧
4. 科学计算库NumPy
5. 使用Pandas进行简单的数据分析
6. 实战案例1:世界幸福指数报告分析
第二课 Pandas进阶及统计分析 (2-3课时)
1. Pandas进阶及技巧
2. 数据合并、分组及比较
3. 透视表
4. 常用的统计分布
5. 使用Python进行假设检验
6. 实战案例2-1:Lending Club借贷数据处理及初步分析
第三课 数据展示及可视化 (2-3课时)
1. 数据可视化的概念及准则
2. 基本图表的绘制及应用场景
-- 散点图,柱状图,线图
3. 数据分析常用图表的绘制
-- 多图绘制,直方图,盒子图,热图
4. 动画及交互式渲染
5. Pandas及Seaborn制图
6. 实战案例3:“神奇宝贝”数据分析及展示
第四课 Python机器学习(1)(2-3课时)
1. 机器学习基本概念与流程
2. Python机器学习库scikit-learn
3. 机器学习常用算法介绍及演示(1)
-- KNN, 线型回归,逻辑回归,SVM,决策树
4. 实战案例4-1:根据可穿戴设备识别用户行为
第五课 Python机器学习(2) (2-3课时)
1. 模型评价指标及模型选择
2. 交叉验证
3. 机器学习常用算法介绍及演示(2)
-- 朴素贝叶斯,随机森林,GBDT
4. 实战案例4-2:根据可穿戴设备识别用户行为
第六课 图像数据处理及分析 (2-3课时)量化分析基础
1. 图像数据操作
2. 常用的图像特征描述
3. K-Means聚类及图像压缩
4. 实战案例5-1:根据海报预测电影分类
第七课 神经网络及深度学习 (2-3课时)
1. 人工神经网络
2. 深度学习
3. TensorFlow框架学习及使用
4. TensorFlow实现卷积神经网络 (CNN)
5. 实战案例5-2:根据海报预测电影分类
第八课 文本数据分析 (2-3课时)
1. Python文本数据处理
-- 正则表达式结合Pandas使用技巧
2. 自然语言处理及NLTK
3. 文本特征及分类
4. 主题模型及LDA
5. 实战案例6:豆瓣影评数据分析
第九课 社交网络分析 (2-3课时)
1. 图论简介
2. 网络的操作及可视化
3. 网络分析
4. 课程总结
5. 实战案例7:“权利的游戏”人物关系分析