本次分享一个Python数据探索小工具dshelper,适合快速查看数据基本特征、数据可视化等使用场景。
- 支持命令行、jupyter notebook、docker三种使用模式。
dshelper:安装
pip install dshelper
dshelper:快速上手
下面简单介绍使用,
第一步,需要几行代码导入包、读入数据集,
import dshelper
import pandas as pd
df = pd.read_csv('./titanic.csv')
dshelper.dshelp(df) #一行代码调用dshelper
第二步,界面操作数据将第一步代码存于run_demo.py中,pythonw run_demo.py
即可调出以下界面,

dshelper:数据集描述统计


dshelper:数据可视化
dshelper支持7类图表,histogram、heatmap、correlation、scatter、box、violin、pair
;
底层调用的是seaborn,所以比较美观.



dshelper:Jupyter Notebook中使用
代码第一行添加:%gui wx
,
dshelper:Docker中使用
make build
to build the projectmake runlinux
to run in Linux
dshelper:未来值得期待
dshelper已经有详细的迭代计划,会新增多种数据格式导入、大数据抽样、时间序列等等,值得期待。