AMiner平台由清华大学计算机系研发,拥有我国完全自主知识产权。平台包含了超过2.3亿学术论文/专利和1.36亿学者的科技图谱,提供学者评价、专家发现、智能指派、学术地图等科技情报专业化服务。系统2006年上线,吸引了全球220个国家/地区1000多万独立IP访问,数据下载量230万次,年度访问量超过1100万,成为学术搜索和社会网络挖掘研究的重要数据和实验平台。
ACL 2021 论文推荐
XRJL-HKUST at SemEval-2021 Task 4: WordNet-Enhanced Dual Multi-head Co-Attention for Reading Comprehension of Abstract Meaning(XRJL-HKUST at SemEval-2021 Task 4:词汇网增强的双多头共同关注抽象意义的阅读理解)
论文链接:https://www.aminer.cn/pub/6064524691e011538305cfe2/?conf=acl2021
推荐理由: 本文介绍了作者提交的SemEval 2021任务4:抽象意义的阅读理解的系统。该系统使用了一个大型的预训练语言模型作为编码器,以及一个额外的双多头共同注意力层来加强段落和问题-答案对之间的关系,遵循目前最先进的模型DUMA。而主要区别在于,作者将段落-问题和问题-段落的注意力模块堆叠在一起,而非平行计算,以模拟重新考虑的过程。作者还增加了一个层规范化模块来提高模型性能。此外,为了纳入已知的关于抽象概念的知识,作者从WordNet中检索了候选答案的定义,并将它们作为额外的输入输入到模型中。该系统被称为WordNet-enhanced DUal Multi-head Co-Attention(WN-DUMA),在子任务1和子任务2的官方盲测集上分别取得了86.67%和89.99%的准确率。
Lone Pine at SemEval-2021 Task 5: Fine-Grained Detection of Hate Speech Using BERToxic(孤松在SemEval-2021任务5:使用BERToxic精细检测仇恨言论)
论文链接:https://www.aminer.cn/pub/607021b391e01101ef3d8a87/?conf=acl2021
推荐理由: 本文介绍了作者解决有毒跨度检测问题(SemEval-2021任务5)的方法。作者提出了BERToxic系统,该系统对预先训练好的BERT模型进行微调,以定位给定文本中的有毒文本跨度,并利用额外的后处理步骤来细化边界。其中,后处理步骤包括:(1)将连续的有毒标记之间的字符偏移量标记为有毒;(2)为至少一个标记为有毒的词分配一个有毒标签。实验表明,上述两个后处理步骤使模型在测试集上的性能提高了4.16%。该工作还研究了数据增强和集合建模策略对系统的影响。同时,系统明显优于所提供的基线,取得了0.683的F1分数,使孤松在91个参赛队中排名第17位。
AMiner,AI赋能的学术搜索平台:https://www.aminer.cn/
#AMiner# #论文#