社区所有版块导航
Python
python开源   Django   Python   DjangoApp   pycharm  
DATA
docker   Elasticsearch  
aigc
aigc   chatgpt  
WEB开发
linux   MongoDB   Redis   DATABASE   NGINX   其他Web框架   web工具   zookeeper   tornado   NoSql   Bootstrap   js   peewee   Git   bottle   IE   MQ   Jquery  
机器学习
机器学习算法  
Python88.com
反馈   公告   社区推广  
产品
短视频  
印度
印度  
Py学习  »  Git

清华大学开源了一项神器,已经在GitHub爆了

Github喵 • 3 年前 • 347 次点击  

来自:开源最前线

最近,清华大学在GitHub开源了一项神器叫万词王(Want Wrong),号称是首个支持中文及跨语言查询的开源在线反向词典。


什么叫反向词典呢?普通的词典告诉你某个词语的定义,而反向词典恰好相反,可以告诉你哪些词语符合你输入描述的意思。下图为万词王在线反向词典的页面截图,其中演示了反向查词的一个示例,输入“山非常高”,系统将返回一系列模型认为表达“山非常高”意思的词语,例如“高峻”、“巍峨”等。

反向词典可以用来做什么?
  • 解决“舌尖现象”(tip-of-the-tongue,又称话到嘴边说不出来),即暂时性忘词的问题

  • 帮助语言学习者学习、巩固词汇

  • 改善选词性失语者患者的生活质量,该病的症状是可以识别并描述一个物体,但是无法记起该物体的名字


简单来说,就是现在的年轻人都会有词穷的时候,当你词穷的时候,这个工具就可以派上用场了,比如你心慌意乱拿不定主意的时候,不知道用哪个词,你就可以将它输进去,就会得到犹豫不决、不意乱心慌等100个词语。而且词性和韵脚也是可以自定义选择。


除此之外,它还支持汉语、英语、汉英、英汉等多种不同转化方式。


整体的系统架构也很简单:


万词王的核心模型是之前清华大学计算机系自然语言处理实验室(THUNLP)发表在AAAI-20上的一篇论文提出的多通道反向词典模型:Multi-channel Reverse Dictionary Model [论文] [代码],其模型架构如下所示:



目前,Wantwords已经在GitHub上标星 1K,累计分支 56 个(GitHub地址:https://github.com/thunlp/WantWords

--- EOF ---

往期内容:

高仿版饿了么

GitHub标星14K!程序员人手必备的开源备份工具

面试官又整新活,居然问我for循环用i++和++i哪个效率高?


Python社区是高质量的Python/Django开发社区
本文地址:http://www.python88.com/topic/123803
 
347 次点击