社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Python

那些被低估了的 Python 库

Python入门与进阶 • 4 年前 • 469 次点击  

译文:头条号:机器学习与数据分析 
原文:https://towardsdatascience.com/the-most-underrated-python-packages-e22bf6049b5e?gi=f9ed1a098270


在这篇文章中,我们想展示一些不同于流行的东西。这些都是深夜浏览GitHub的感悟,以及同事们分享的压箱底东西。这些软件包中的一些是非常独特的,使用起来很有趣的Python包。

那些被低估的Python库

混合派

  1. Knock Knock:从Python发送通知到移动设备、桌面或电子邮件。
  2. tqdm:可扩展的Python和CLI进度条,内置对pandas的支持。
  3. Colorama:简单的跨平台彩色终端文本。
  4. pandas -log:提供熊猫基本操作的反馈。非常适合调试长管道链。
  5. Pandas-flavor:扩展pandas DataFrame/Series的简单方法。
  6. More-Itertools:增加了类似于itertools的额外功能。
  7. streamlit:为机器学习项目创建应用程序的简单方法。

数据清理和操作

  1. ftfy:修复mojibake和Unicode文本中的其他故障。
  2. janitor:有很多很酷的功能来清理数据。
  3. Optimus:另一个数据清理包。
  4. Great-experctations:一个检查数据是否符合预期的好工具。
那些被低估的Python库

数据探索和建模

  1. Pandas-profile:创建一个包含来自pandas DataFrame的统计数据的HTML报告。
  2. dabl:允许使用可视化和预处理进行数据探索。
  3. pydqc:允许比较两个数据集之间的统计数据。
  4. pandas-summary:对panda DataFrames描述功能的扩展。
  5. pivottable-js:pands在jupyter notebook的拖放功能。

数据结构

  1. Bounter:有效的计数器,使用有限(有界)的数量的内存,无论数据大小。
  2. Python -bloomfilter:可扩展的Bloom Filter,使用Python实现。
  3. datasketch:提供概率数据结构,如LSH、加权MinHash、HyperLogLog等。
  4. ranges:Python的连续范围、范围集和范围令数据结构
那些被低估的Python库

性能检查和优化

  1. Py-spy: Python程序的采样分析器。
  2. pyperf:用于运行Python基准测试的工具箱。
  3. snakeviz:一个浏览器内的Python配置文件查看器,对jupyter notebook有很大的支持。
  4. Cachier: Python函数的持久、无延迟、本地和跨机缓存。
  5. Faiss:用于高效的相似性搜索和密集向量聚类的库。

- EOF -


回复关键字“简明python ”,立即获取入门必备书籍简明python教程》电子版

回复关键字爬虫”,立即获取爬虫学习资料

python入门与进阶
每天与你一起成长

推荐阅读

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/111418
 
469 次点击