清华大学开源了一项神器,已经在GitHub爆了

清华大学在GitHub上开源了万词王(WantWrong),这是一个支持中文及跨语言查询的在线反向词典。它能帮助用户解决忘词问题,尤其对语言学习者和选词性失语者有益。系统基于多通道反向词典模型,用户输入描述即可获取相应含义的词语。此外,万词王还支持词性筛选和多种语言转换。该项目由THUNLP开发,目前在GitHub上有较高关注度。

 
今天给分享一个非常实用的开源项目,具体的内容往下看!

2e8e65f3f17d61a6a8f44550c228a13f.png

开源最前线(ID:OpenSourceTop) 猿妹 整编

整理自:https://github.com/pwxcoo/chinese-xinhua

最近,清华大学在GitHub开源了一项神器叫万词王(Want Wrong),号称是首个支持中文及跨语言查询的开源在线反向词典。

7dc500a59066713878ba40bed96d5470.png

什么叫反向词典呢?普通的词典告诉你某个词语的定义,而反向词典恰好相反,可以告诉你哪些词语符合你输入描述的意思。下图为万词王在线反向词典的页面截图,其中演示了反向查词的一个示例,输入“山非常高”,系统将返回一系列模型认为表达“山非常高”意思的词语,例如“高峻”、“巍峨”等。

反向词典可以用来做什么?

  • 解决“舌尖现象”(tip-of-the-tongue,又称话到嘴边说不出来),即暂时性忘词的问题

  • 帮助语言学习者学习、巩固词汇

  • 改善选词性失语者患者的生活质量,该病的症状是可以识别并描述一个物体,但是无法记起该物体的名字

简单来说,就是现在的年轻人都会有词穷的时候,当你词穷的时候,这个工具就可以派上用场了,比如你心慌意乱拿不定主意的时候,不知道用哪个词,你就可以将它输进去,就会得到犹豫不决、不意乱心慌等100个词语。而且词性和韵脚也是可以自定义选择。

0853a33c2ace31b6aef5b3d232f82d22.png

除此之外,它还支持汉语、英语、汉英、英汉等多种不同转化方式。

ace56dadcce44e9b39d232a944e48808.png

整体的系统架构也很简单:

8a1205146d438c95e633b80152e9d2d6.png

万词王的核心模型是之前清华大学计算机系自然语言处理实验室(THUNLP)发表在AAAI-20上的一篇论文提出的多通道反向词典模型:Multi-channel Reverse Dictionary Model [论文] [代码],其模型架构如下所示:

f5c4f7da3fc080e860133b2a53b11786.png

关于清华大学自然语言处理与社会人文计算实验室

清华大学计算机系自然语言处理与社会人文计算实验室(THUNLP)成立于20世纪70年代末,最初在黄昌宁教授的带领下从事中文信息处理方面的研究工作,是国内开展自然语言处理研究最早、深具影响力的科研单位,同时也是中国中文信息学会(全国一级学会)计算语言学专业委员会的挂靠单位。实验室学术带头人为孙茂松教授,实验室教师队伍还包括刘洋教授和刘知远副教授。实验室面向以中文为核心的自然语言处理前沿基础课题开展系统深入的研究工作,研究领域涵盖计算语言学的核心问题以及社会计算和人文计算,近年来在973、863、国家自然科学基金等项目的支持下,实验室师生在IJCAI、AAAI、ACL、EMNLP等国际顶级会议和期刊上发表多篇高水平学术论文,与CMU、NUS、Google等国际名校和企业有长期良好的合作关系,培养的优秀毕业生大多到清华大学、谷歌、百度、阿里、微软等著名高校和企业工作。

WantWords由THUNLP开发和维护,项目指导教师为孙茂松教授和刘知远副教授,开发团队成员包括岂凡超,张磊,杨延辉。

75751dc0d09f32b81711622b54efc71d.png

目前,Wantwords已经在GitHub上标星 1.2K,累计分支 56 个(GitHub地址:https://github.com/thunlp/WantWords)

OK!到这就是这期分享

如果觉得文章有用,请点赞在看,分享、关注我

相关阅读:

分享几款超好用的 REST API 工具

推荐一款开源的GitHub简历制作工具

如何优雅地给妹子优化电脑?

明天见(。・ω・。)ノ♡
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值