本来想做一下DEM数据的操作的,结果显示数据太大。。。也就两百多M的数据。所以决定做一下天气数据的探索性分析。
使用到的数据格式.csv,数据来自于kaggle,地址是:https://www.kaggle.com/muthuj7/weather-dataset。打开网址后就可以看到数据的一些简要信息了。把数据下载到本地,用pandas.read_csv()去读取
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
读取进来之后就是pandas的DataFrame格式的,可以直观的看到数据的结构了
对数据进行一下类型的转换
# 类型转换
data['Temperature (C)'] = data['Temperature (C)'].astype('float')
data['Apparent Temperature (C)'] = data['Apparent Temperature (C)'].astype('float')
data['Humidity'] = data['Humidity'].astype('float')
data['Wind Speed (km/h)'] = data['Wind Speed (km/h)'].astype('float')
data['Wind Bearing (degrees)'] = data['Wind Bearing (degrees)'].astype('int')
data['Visibility (km)'] = data['Visibility (km)'].astype('float')
data['Loud Cover'] = data['Loud Cover'].astype('float')
data['Pressure (millibars) '] = data['Pressure (millibars)'].astype('float')
并且没有null值
说没有空值就没有
转换一下时间格式
然后汇总统计一下各要素的分布情况
weather = data['Summary'].value_counts().reset_index()
weather.columns = ['weather','count']
weather
看看气温的绘图结果
再看看湿度的
最后,我们可以使用pywedge这个库做一个面板来绘图,绘图的形式还是挺多的,首先是pip安装一下这个库
然后导入进去开始准备绘图
import pywedge as pd
huitu = pw.Pywedge_Charts(data,c=None,y='Humidity')
fig = huitu.make_charts()
结果如下,这样的话你就可以比较方便地绘制不同的图形啦