社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Git

NLP 研究索引神器,3000+代码库,一键查找论文、GitHub库

大数据与机器学习文摘 • 2 年前 • 344 次点击  

NLP 领域非常实用的索引工具「The NLP Index」。


说到搜索,学术搜索也是一门学问。

擅于运用搜索可以帮助你快速寻找想要的学术资料,起到事半功倍的效果。比如我们常用到的论文及对应源码的神器 Papers With Code,就收录了很多 SOTA 论文和代码,直接搜索论文关键字就可以得到相关的论文和代码,还可以分领域进行搜索;又比如 arXiv 与文献调研神器 Connected Papers 强强联合,每篇 arXiv 论文可以在摘要页面直接链接到其在 Connected Papers 中的关联论文图。

这种超级实用的搜索工具,可以方便研究者查找学术资料,节省了大量时间,并且可以提供最优搜索结果。

这里我们介绍一个非常实用的 NLP 索引工具「The NLP Index」,同样也是为学术搜索而开发,它是免费且开源的。


项目地址:https://index.quantumstat.com/

「The NLP Index」拥有 3000 多个代码库,使用者可以搜索其中一个侧栏,侧栏中包含当今 NLP 中一些最重要的主题。当你键入相关内容时,就可以进行搜索。其索引包括 arxiv 研究论文 PDF 格式、文献调研神器 ConnectedPapers 链接及其相应的 GitHub 代码库,可谓将这三款学术神器进行了综合。

「The NLP Index」介绍

「The NLP Index」左侧栏有 10 个模块,如下图所示,包括数据(数据扩充、数据集等)、任务(关系提取、语音识别等)、相关领域(医疗、金融等)、模型(BERT、BART 等)、语言类型(跨语言、多语言等)、模型范围(字符级别、句子级别等)、包含架构(编码器、解码器等)、PIPELINE 等。


我们以左侧栏中第三个模块「MODELS(模型)」为例。点击该模块,下拉框会出现如下图所示的界面,在「MODELS(模型)」下面包含有比较常用到的模型,比如 cnn、rnn、bart、bert、gpt-2等。



MODELS 下拉框包含的部分内容。

我们随机点击其中任意模型,如「bert」,右侧会显示出带有「BERT」关键字的相关论文,并以蓝色字体突出显示,除此以外还会显示论文摘要、论文作者、论文 PDF 链接、Graph 链接以及 GitHub 链接,方便使用者快速查找。


当鼠标放在对应的模块上面(如摘要、作者等),相关内容会全部显示,以供使用者了解该论文的整体内容。


除此以外,「The NLP Index」还关联了 Connected Papers,点击 Graph 界面跳转至生成的文献分析网络图,结果页面分三栏,左边一栏是本文以及相关参考文献的题目,右边一栏是相关参考文献的具体内容,而中间一栏是文献检索分析图谱。可以在线进行分析文献的引文信息,轻松了解某篇文献的引用和被引用关联,分析出文献的前世今生,方便研究者对一篇文献或者某个领域进行调研。


对于这个免费且开放的索引工具,有网友表示:「这太神奇了。数据来自 Papers With Code 吗?」


还有网友表示:「非常感谢为其他人提供了便利。」


参考链接:
https://www.reddit.com/r/MachineLearning/comments/mzor46/the_nlp_index_3000_code_repos_for_hackers_and/

转自:机器之心

- EOF -

推荐阅读  点击标题可跳转

1、NLP 面试宝典:38 个最常见 NLP 问题答案

2、4 条实用小建议,送给初入 NLP 领域的你

3、科学家「黑进」果蝇大脑跑NLP任务,发现效率比BERT高


看完本文有收获?请转发分享给更多人

关注「大数据与机器学习文摘」,成为Top 1%

点赞和在看就是最大的支持❤️

Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/113743
 
344 次点击