编程基础及数据清洗→(爬虫)→机器学习→文本分析&机器学习进阶
→不同于其他Python课程,单独为学术研究打造的Python机器学习学术应用课程陈远祥老师,北京邮电大学副教授 。2014年毕业于北京大学,获通信与信息系统专业博士学位,2015年-2017年在北京大学做博士后研究。
发表SCI/EI学术论文100余篇,其中第一或通讯作者论文60余篇,申请发明专利20项。主持国家自然科学基金面上项目,国家重点研发计划子课题,国家自然科学基金青年项目及博士后基金等多个国家级和省部级项目。IEEE、OSA会员,Optics Express, IEEE Photonics Technology Letters,Photonics Journal,Applied Optics等多个SCI期刊审稿人。陈远祥老师近2年开设的Python师资培训系列课程受到了高校群体的认可:C1:前言
C2:Python语言概述
C3:Python中的数据类型
C4:控制流
C5:函数设计与使用
C6:面向对象编程
C7:文件操作
C8
:Numpy
C9:pandas
C10:matplotlib绘图
C11:pyechart绘图
1.1 爬虫基本概念
1.2 通用爬虫和聚焦爬虫
1.3 http的请求与响应
1.4 网页基础知识
2.1 爬虫基本原理
2.2 爬虫与反爬虫
2.3 正则表达式
2.4 requests库实现http请求
2.4.1 实战1:豆瓣电影分类排行榜(JSON数据格式)
2.4.2 实战2:猫眼电影排行榜数据提取
2.4.3 实战3:基于cookies爬取豆瓣短评分析
2.5 Beautiful Soup
2.5.1 网页的解析
2.5.2 网页元素的选取
2.5.3 实战:从中国天气网获得天气数据;爬取豆瓣电视剧评分
3.1 多页面的爬取
3.2 动态渲染页面的爬取
3.3 基于selenium的自动化爬取技术
3.4 实战:多页面爬取京东商品数据
- 语料的加载,文本特征的提取,利用聚类算法对文本进行聚类
·机器学习基本思想
·机器学习分类
·常用机器学习常用算法
·机器学习评价标准
·机器学习算法库介绍
·机器学习常见学术应用
KNN算法基本原理,常用相似度衡量方法、KNN用于分类和回归,KNN模型的优化与调参决策树基本原理,决策树分类,决策树用于分类和回归实现,决策树参数优化线性回归模型基本原理、岭回归、LASSO回归和弹性网案例应用:基于不同场景之下共享单车投放量的精准预测逻辑回归基本原理,从线性回归到逻辑回归,逻辑回归实现和参数优化神经网络基础,神经网络中的激活函数,神经网络Python实现与参数调优,深度学习简介决策树与随机森林,随机森林原理,随机森林Python实现与参数调优聚类原理,聚类和分类区别,kmeans聚类原理,kmeanspython实现,模型评估指标及稳定性讨论1、机器学习学术应用:数据发现与变量创造,预测,因果推断成功案例分享:基于机器学习的损伤感知与补偿机制研究
