社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

优雅的艺术之Python数据可视化

马哥Linux运维 • 8 年前 • 762 次点击  

最近看《机器学习系统设计》…前两章。学到了一些用Matplotlib进行数据可视化的方法。在这里整理一下。

声明:由于本文的代码大部分是参考书中的例子,所以不提供完整代码,只提供示例片段,也就是只能看出某一部分用法,感兴趣的需要在自己的数据上学习测试。

最开始,当然还是要导入我们需要的包:


1. 画散点图

画散点图用plt.scatter(x,y)。画连续曲线在下一个例子中可以看到,用到了plt.plot(x,y)。

plt.xticks(loc,label)可以自定义x轴刻度的显示,第一个参数表示的是第二个参数label显示的位置loc。

plt.autoscale(tight=True)可以自动调整图像显示的最佳化比例 。


画出散点图如下:

2. 多项式拟合并画出拟合曲线

## 多项式拟合


效果图:

3. 画多个子图

这里用到的是sklearn的iris_dataset(鸢尾花数据集)。

此数据集包含四列,分别是鸢尾花的四个特征:

  • sepal length (cm)——花萼长度

  • sepal width (cm)——花萼宽度

  • petal length (cm)——花瓣长度

  • petal width (cm)——花瓣宽度

这里首先对数据进行一定的处理,主要就是对特征名称进行两两排列组合,然后任两个特征一个一个做x轴另一个做y轴进行画图。

这里有一个排列组合参考代码,最后是取出了两两组合的情况。

排列组合的结果是feature_names_2包含了排列组合的所有情况,它的每一个元素包含了一个排列组合的所有情况,比如第一个元素包含了所有单个元素排列组合的情况,第二个元素包含了所有的两两组合的情况……所以这里取出了第二个元素,也就是所有的两两组合的情况

下面是在for循环里画多个子图的方法。对我来说,这里需要学习的有不少。比如

for i,k in enumerate(feature_names_2[1]):这一句老是记不住。

比如从列表中取出某元素所在的索引的方法:index1 = feature_names.index(k[0]),也即index = list.index(element)的形式。

比如for循环中画子图的方法:plt.subplot(2,3,1+i)

比如for循环的下面这用法:for t,marker,c in zip(range(3),”>ox”,”rgb”):

这里的可视化效果如下:

4. 画水平线和垂直线

比如在上面最后一幅图中,找到了一种方法可以把三种鸢尾花分出来,这是我们需要画出模型(一条直线)。这个时候怎么画呢?

下面需要注意的就是plt.vlines(x,y_min,y_max)和plt.hlines(y,x_min,x_max)的用法。

此时可视化效果如下:

5. 动态画图

plt.ion()打开交互模式。plt.show()不再阻塞程序运行。

注意plt.axis()的用法。

可视化效果:

作者:小恩

来源:http://www.cnn6.net/html/bigdata/201765/201946.html


点击图片,了解更多课程详情

——马哥教育,让你懂更让你行——


今天看啥 - 高品质阅读平台
本文地址:http://www.jintiankansha.me/t/443oZKPn8I
Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/2478
 
762 次点击