星标:21700,提交数:379,贡献者:47。fastText是一个可高效学习单词表意和句子分类的库。
星标:17400,提交数:11628,贡献者:482 。使用Python和Cython实现的工业级自然语言处理库(NLP)
星标:11200,提交数:4024,贡献者:361。gensim通过使用大型语料库进行主题建模、文档索引和相似性检索。目标受众是自然语言处理(NLP)和信息检索(IR)社区。
星标:9300,提交数:13990,贡献者:319。NLTK——自然语言工具箱——是一整套针对自然语言处理研究和开发的开源Python模块、数据集和教程。
13. Datasets(Huggingface)
星标:4300,提交数:568,贡献者:64。用于自然语言处理的使用PyTorch,TensorFlow,NumPy和Pandas工具的快速,高效,开放式数据集和评估指标。
14. Tokenizers(Huggingface)
星标:3800,提交数:1252,贡献者:30。针对研究和生产的快速顶级的分词器。
15. Transformers(Huggingface)
星标:3500,提交数:5480,贡献者:585。Transformers:针对Pytorch和TensorFlow 2.0 的顶级自然语言处理库。
星标:4800,提交数:1514,贡献者:19。针对很多人类语言的正式标准NLP Python库。
星标:7300,提交数:542,贡献者:24。简单,Python风格,文本处理-情感分析,词性标记,名词短语提取,翻译等等。
星标:1800,提交数:442,贡献者:15。用于PyTorch自然语言处理(NLP)的基础实用工具。
星标:1500,提交数:1324,贡献者:23 。用于执行各种自然语言处理(NLP)任务的Python库,构建在一个高性能spaCy库之上。
星标:626,提交数:1405,贡献者:13。Finetune是一个库,它允许用户利用最新的预训练NLP模型来执行各种下游任务。
星标:1900,提交数:266,贡献者:17。文本预处理、表示和可视化,从零到精通。
星标:1700,提交数:4363,贡献者:50。Spark NLP是建立在Apache Spark ML之上的自然语言处理库。
星标:2200,提交数:712,贡献者:72。GluonNLP这个工具包,可简化文本预处理,数据集加载和神经模型构建,以帮助您加快对自然语言处理(NLP)的研究。