Py学习  »  机器学习算法

我们的《机器学习》课程被认定为浙江省一流课程

机器学习算法与自然语言处理 • 1 年前 • 230 次点击  


MLNLP社区是国内外知名的机器学习与自然语言处理社区,受众覆盖国内外NLP硕博生、高校老师以及企业研究人员。
社区的愿景是促进国内外自然语言处理,机器学习学术界、产业界和广大爱好者之间的交流和进步,特别是初学者同学们的进步。
转载自 | 机器学习初学者

文件链接:http://jyt.zj.gov.cn/art/2022/11/15/art_1228998760_58938731.html

近日,浙江省教育厅公布了2022年省级一流本科课程认定结果,黄海广老师在中国大学慕课的《机器学习》课程,被认定为浙江省一流线上课程。


目前已经开课第四轮,共2万人报名学习,目前还可以报名学习。

课程地址:

https://www.icourse163.org/course/WZU-1464096179


1

『课程介绍』

Machine Learning(机器学习)是人工智能的核心,本课程用通俗和结合案例的方式,讲解机器学习算法,如经典算法:线性回归、逻辑回归、决策树等,也将讲解近几年才出现的如XGBoost、LightGBM等集成学习算法。此外,这门课还会讲解利用机器学习解决问题的实用技术,还包括Python、Scikit-learn工具的使用等等。

通过本课程,你不仅得到理论基础的学习,而且获得那些利用机器学习解决问题的实用技术,包括机器学习工具的使用等等。

与国内外很多非常优秀的机器学习课程或作品相比(如吴恩达机器学习课程、李航老师的统计学习方法、周志华老师的《机器学习》等),本课程对初学者来说,更加容易理解,本课程属于“雪中送炭”,而不是“锦上添花”,更适合初学者学习,主要解决初学者的三个问题:

  • 就是资料太多,难以取舍;

  • 理论性强,初学比较困难;

  • 代码资料比较少。

课程门槛较低,只要有本科三年级以上的数学知识,会一种编程语言,就可以掌握这门课程的绝大部分内容。

课程链接:
https://www.icourse163.org/course/WZU-1464096179

课程资源公布在Github:

https://github.com/fengdu78/WZU-machine-learning-course


2

『授课目标』

1、掌握机器学习的基本问题定义、基本模型,对机器学习学科有概览性的认识。

2、掌握目前主流的机器学习算法和模型,并能够根据实际问题的需要选择并实现相应的算法。

3、编程完成机器学习典型应用实例,对机器学习工程编程有初步的训练。


3

『课程大纲』

  • 01 引言

    • 1.1 机器学习概述

    • 1.2 机器学习的类型

    • 1.3 机器学习的背景知识

    • 1.4 机器学习的开发流程

  • 02 回归

    • 2.1 线性回归

    • 2.2 梯度下降

    • 2.3 正则化

    • 2.4 回归的评价指标

  • 03 逻辑回归

    • 3.1 分类问题

    • 3.2 Sigmoid函数

    • 3.3 逻辑回归求解

    • 3.4 逻辑回归的代码实现

  • 04  朴素贝叶斯

    • 4.1 贝叶斯方法

    • 4.2 朴素贝叶斯原理

    • 4.3 朴素贝叶斯案例

    • 4.4 朴素贝叶斯代码实现

  • 05 机器学习实践

    • 5.1 数据集划分

    • 5.2 评价指标

    • 5.3 正则化、偏差和方差

  • 06 机器学习库Scikit-learn

    • 6.1 机器学习库Scikit-learn概述

    • 6.2 机器学习库Scikit-learn的主要用法

    • 6.3 机器学习库Scikit-learn的使用案例

  • 07 KNN算法

    • 7.1 距离度量

    • 7.2 KNN算法

    • 7.3 KD树划分

    • 7.4 KD树搜索

  • 08 决策树

    • 8.1 决策树原理

    • 8.2 ID3算法

    • 8.3 C4.5算法

    • 8.4 CART算法

  • 09 集成学习

    • 9.1 集成学习方法概述

    • 9.2 AdaBoost和GBDT算法

    • 9.3 XGBoost算法

    • 9.4 LightGBM算法

    • 9.5 集成学习的代码实现

  • 10 人工神经网络

    • 10.1 人工神经网络概述

    • 10.2 感知机算法

    • 10.3 反向传播算法(BP算法)

  • 11 支持向量机

    • 11.1 支持向量机概述

    • 11.2 线性可分支持向量机

    • 11.3 线性支持向量机

    • 11.4 线性不可分支持向量机

    • 11.5 支持向量机的代码实现

  • 12 聚类

    • 12.1 无监督学习概述

    • 12.2 K-means聚类

    • 12.3 密度聚类和层次聚类

    • 12.4 聚类的评价指标

  • 13 降维

    • 13.1 降维概述

    • 13.2 SVD(奇异值分解)

    • 13.3 PCA(主成分分析)

  • 14 关联规则

    • 14.1 关联规则概述

    • 14.2 Apriori 算法

    • 14.3 FP-Growth算法

  • 15 机器学习项目流程

    • 15.1 机器学习项目流程概述

    • 15.2 数据清洗

    • 15.3 特征工程

    • 15.4 数据建模 

课程大纲可能会有小范围调整。

课程每个单元会有20道题目的测验,还有期末考试。

课程资源公布在Github:

https://github.com/fengdu78/WZU-machine-learning-course


4

『预备知识』

数学基础:主要包括高等数学、线性代数、概率论与数理统计。最低要求:大三上学期的数学水平。

编程基础:已经掌握一种编程工具,最好会使用Python进行简单地编程。


5

『课程定位』

基础入门课,适合大三以上的本科生,或者初学机器学习的硕士生,博士生,也适合对机器学习感兴趣的毕业生。
与其他优秀的机器学习课程相比,本课程内容相对简单易懂,资料全面,课程团队坚信:让地方性本科院校的学生也能入门机器学习。

进阶用户建议选择其中部分内容学习。


6

『课程答疑』

回答下几个比较突出的问题:

1.机器学习课程那么多,这门慕课有什么不同之处?

与国内外很多非常优秀的机器学习课程或作品相比(如吴恩达机器学习课程、李航老师的统计学习方法、周志华老师的《机器学习》等),本课程对初学者来说,属于“雪中送炭”,而不是“锦上添花”,更适合初学者学习,主要解决初学者的三个问题:

  • 就是资料太多,难以取舍;

  • 理论性强,初学比较困难;

  • 代码资料比较少。

学完这门课,机器学习应该就入门了,也会知道进一步需要学习什么。

2.课程过于简单,有些细节没有讲清楚。

这个有两个原因:

第一是慕课通常一个视频在15分钟之内,所以,有些知识点不能讲太细,否则会超时,因此有所取舍。

第二是课程定位问题,这门课程定位是入门基础课程,并非进阶课程,要照顾到广大初学者,特别是大三学生,所以有些知识点没有讲太详细,点到为止,比如支持向量机一章,如果详细讲,可能要超过两个小时,但这章的慕课只讲了40分钟。

3.课程太难,听不懂。

这个应该是基础太薄弱了,应该补下基础,理论上大三的数学水平,学习这门课程应该毫无难度。

4.语速问题

我录课的时候,尽量把语速放慢,这个是因为慕课的要求,语速不能太快,否则大多数读者跟不上进度。

5.代码下载问题

有同学说,课程的代码在github难下载,这里,我将所有代码都上传到慕课了,可以看慕课每章最后,都提供代码下载。

6.课程快结束了,能回放不?

我修改了设置,课程结束仍然可以回放,但前提是要报名这门课。

7.课程的测试题答案

课程练习答案,尚不公开,如果有疑问,可以发邮件haiguang2000@wzu.edu.cn来咨询个别问题。

8.教材问题

我写了一本教材,将要在清华大学出版社出版,目前在出版社加工,内容和慕课是完全匹配的,以后可以直接用这本教材。

9.课件问题

课件ppt原版文件,我可以提供给在校老师,只要用edu邮箱发邮件haiguang2000@wzu.edu.cn,报上姓名和学校,我都会发送全部原版ppt(目前已经发给690多位老师了)。

其他读者可以直接在github下载课件的pdf版本,不影响阅读,地址:

https://github.com/fengdu78/WZU-machine-learning-course


7

『后续学习』

学完这个慕课以后,同学们应该会知道后续应该学习什么,机器学习范围比较大,可以在某方面进行深入钻研。

总之只要数学基础扎实,代码能力强,机器学习、深度学习,都可以学得很好!

后续建议学习李航老师的《统计学习方法》,或者周志华老师的《机器学习》(西瓜书)。


8

『课程资料』

1.如果是在校老师,请告知我们学校和姓名,我可以发原版ppt文件,请用edu邮箱联系我:haiguang2000@wzu.edu.cn

2.其他读者可以直接在github下载,地址:

https://github.com/fengdu78/WZU-machine-learning-course

链接:

https://pan.baidu.com/s/1J3-QU6D3UFVlrjTY75FFLw 

提取码:43s2

为什么只给老师发原版课件?

我希望他们能在我的课件基础上修改完善,这样他们可以更好地把机器学习课程上好。其他读者下载的是pdf版本,Pdf版本的课件和原版ppt文件一致,在学习上没有区别,因为公开了,还是担心有些机构拿到原版文件用于商业用途(如收费培训),见谅!

部分课件截图


9

『如何学习?』

课程在中国大学慕课开课,这个平台是免费的。

课程地址:

https://www.icourse163.org/course/WZU-1464096179

点击下方『阅读原文』立即报名。


技术交流群邀请函

△长按添加小助手

扫描二维码添加小助手微信

请备注:姓名-学校/公司-研究方向
(如:小张-哈工大-对话系统)
即可申请加入自然语言处理/Pytorch等技术交流群

关于我们

MLNLP 社区是由国内外机器学习与自然语言处理学者联合构建的民间学术社区,目前已经发展为国内外知名的机器学习与自然语言处理社区,旨在促进机器学习,自然语言处理学术界、产业界和广大爱好者之间的进步。
社区可以为相关从业者的深造、就业及研究等方面提供开放交流平台。欢迎大家关注和加入我们。

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/149702
 
230 次点击