社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

Python 机器学习视频课 - 2. Scikit-Learn 中

王的机器 • 3 年前 • 818 次点击  

这是 Python 数据机器学习系列的第二节《Scikit-Learn 中》


  1. Scikit-Learn 上


Python 数据可视化
  1. Matplotlib 上

  2. Matplotlib 下

  3. Seaborn 上

  4. Seaborn 中

  5. Seaborn 下

  6. Bokeh

  7. Plotly

  8. Cufflinks

  9. PyEcharts


Python 数据分析
  1. NumPy 上

  2. NumPy 下

  3. Pandas 上

  4. Pandas 下

  5. SciPy 上

  6. SciPy 下

  7. Pandas 时间序列

  8. Pandas 高频数据采样

  9. 默顿模型计量经济资本

  10. LSMC 定价美式和百慕大期权

  11. 负油价和负利率模型

  12. Nelson-Siegel 构建债券收益率曲线

  13. 外汇交易组合保证金制定系统

  14. FR007 利率掉期定价和曲线拔靴

  15. 量化投资 - 向量化回测


Python 基础
  1. 编程概览

  2. 元素型数据

  3. 容器型数据

  4. 流程控制:条件-循环-异常处理

  5. 函数上:低阶函数

  6. 函数下:高阶函数

  7. 类和对象:封装-继承-多态-组合

  8. 字符串专场:格式化和正则化

  9. 解析表达式:简约也简单

  10. 生成器和迭代器:简约不简单

  11. 装饰器:高端不简单


Sklearn 中核心 API 接口是估计器,而高级 API 接口是元估计器 (meta-estimator)。元估计器由很多基估计器 (base estimator) 组成。类比高阶函数将低阶函数当参数,元估计器将估计器当参数,其代码范式如下:


    meta_estimator( base_estimator )


本课讨论五种元估计器,它们分别是


  1. 用来集成子模型的 ensemble

  2. 用来多类别和多标签分类的 multiclass

  3. 用来多输出分类的 multioutput

  4. 用于模型选择的 model_selection

  5. 用于数据预处理流水线的 pipeline


本课会用以下 Sklearn 中的模型来举例说明如何使用上述五种元估计器


  • ensemble.BaggingClassifier

  • ensemble.AdaBoostClassifier

  • ensemble.VotingClassifier

  • ensemble.StackingClassifier

  • multiclass.OneVsOneClassifier

  • multiclass.OneVsRestClassifier

  • multioutput.MultiOutputClassifier

  • model_selection.GridSearchCV

  • model_selection.RandomizedSearchCV

  • pipeline.Pipeline

  • pipeline.FeatureUnion



集成估计器

集成估计器是用来做集成学习,该估计器里面有若干个分类器 (classifier) 或回归器 (regressor)。


  • 分类器统计每个子分类器的预测类别数,再用「多数投票」原则得到最终预测。

  • 回归器计算每个子回归器的预测平均值。




多类估计器

多类估计器可以处理多类别 (multi-class) 和多标签 (multi-label) 的分类问题。




多输出估计器

多输出估计器可以处理多输出 (multi-output) 的分类问题。



模型选择估计器

模型选择主要用于评估模型表现,常见的模型选择估计器包括:

  • cross_validate:评估交叉验证的表现。

  • learning_curve:建立学习曲线。

  • GridSearchCV:用交叉验证方法从网格中一组超参数搜索出最佳超参数。

  • RandomizedSearchCV:用交叉验证方法从一组随机超参数分布搜索出最佳超参数。




流水线估计器

流水线估计器把多个估计器串联 (Pipeline) 或并联 (FeatureUnion) 的方式组成一条龙服务。用好了它真的能大大提高效率



想学就开始吧!

绝不会让你失望!


付费用户(付 1 赠 1)可以获得:


  • 观看课程视频 (97 分钟)

  • Python 代码 (Jupyter Notebook)





Jupyter Notebook

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/117837
 
818 次点击