社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  机器学习算法

新手福音,机器学习工具Sklearn 中文文档 0.19版(最新)

机器学习AI算法工程 • 5 年前 • 711 次点击  


向AI转型的程序员都关注了这个号👇👇👇

机器学习AI算法工程  公众号:datayx




Scikit-learn(sklearn)是机器学习中常用的第三方模块,对常用的机器学习方法进行了封装,包括回归(Regression)、降维(Dimensionality Reduction)、分类(Classfication)、聚类(Clustering)等方法。当我们面临机器学习问题时,便可根据下图来选择相应的方法。Sklearn具有以下特点:

    简单高效的数据挖掘和数据分析工具
    让每个人能够在复杂环境中重复使用
    建立NumPy、Scipy、MatPlotLib之上



文档获取方式

关注微信公众号 datayx  然后回复 sk  即可获取。

AI项目体验地址 https://loveai.tech




sklearn把主要的功能分为6个模块。

分类

分类里面,当然就是应用的最广泛的算法,包括SVM、NB、DT等,即离散性监督学习。


回归

回归就是连续性监督学习,SVR、Lasso、甚至最简单的线性回归,都有,同样不展开。


聚类

无监督学习,很出名所以也不展开了,k-means、DBSCAN等,同不展开。


降维

sklearn把降维从数据预处理里面拿了出来,当做是单独的一块,里面包含了PCA、ICA以及一些更为复杂的方法,方便使用。


模型选择

对一个问题,会有很多模型方法可以用,但是哪个是好,那个不好,需要根据建模分析的结果判断,在sklearn中,提供了大量用于计算模型性能和结果的功能,交叉验证、自动调参、量化预测、学习曲线等分析功能,方便进行模型性能分析。


预处理

主要针对特征提取和归一化处理。和降维不同,特征提取是指从众多特征中选取最好的特征进行分析,从而使特征和目标之间更匹配,更有针对性,从而提升结果,提升模型性能,里面涵盖了卡方统计量、相关系数等计算和特征提取功能,另一方面还有二值化、归一化、文本向量化等特别的功能。


Sklearn目录







阅读过本文的人还看了以下:


分享《深度学习入门:基于Python的理论与实现》高清中文版PDF+源代码


《21个项目玩转深度学习:基于TensorFlow的实践详解》完整版PDF+附书代码


《深度学习之pytorch》pdf+附书源码


李沐大神开源《动手学深度学习》,加州伯克利深度学习(2019春)教材


笔记、代码清晰易懂!李航《统计学习方法》最新资源全套!


《神经网络与深度学习》最新2018版中英PDF+源码


将机器学习模型部署为REST API


FashionAI服装属性标签图像识别Top1-5方案分享


重要开源!CNN-RNN-CTC 实现手写汉字识别


yolo3 检测出图像中的不规则汉字


同样是机器学习算法工程师,你的面试为什么过不了?


前海征信大数据算法:风险概率预测


【Keras】完整实现‘交通标志’分类、‘票据’分类两个项目,让你掌握深度学习图像分类


VGG16迁移学习,实现医学图像识别分类工程项目


特征工程(一)


特征工程(二) :文本数据的展开、过滤和分块


特征工程(三):特征缩放,从词袋到 TF-IDF


特征工程(四): 类别特征


特征工程(五): PCA 降维


特征工程(六): 非线性特征提取和模型堆叠


特征工程(七):图像特征提取和深度学习


如何利用全新的决策树集成级联结构gcForest做特征工程并打分?


Machine Learning Yearning 中文翻译稿


蚂蚁金服2018秋招-算法工程师(共四面)通过


全球AI挑战-场景分类的比赛源码(多模型融合)


斯坦福CS230官方指南:CNN、RNN及使用技巧速查(打印收藏)


python+flask搭建CNN在线识别手写中文网站


中科院Kaggle全球文本匹配竞赛华人第1名团队-深度学习与特征工程


不断更新资源

深度学习、机器学习、数据分析、python

 搜索公众号添加: datayx  

长按图片,识别二维码,点关注


AI项目体验

https://loveai.tech



Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/34508
 
711 次点击