每天一篇自然语言处理论文:202003

本文汇总了作者2020年3月每天一篇的自然语言处理(NLP)论文阅读,涉及论文的高难度样本生成、深度学习在语音识别和文本分类的应用、模型可视化、反深度学习策略、时间序列预测、词向量正则化等多个方面。通过这些论文,探讨了NLP领域的最新研究进展和挑战,包括如何提高模型的训练效率、理解和解释模型行为、以及应对数据不平衡等问题。

1 说明

这些日子,开始养成看论文的习惯,也参加了AI研习社推荐论文的活动,其中一些推荐了但是未被采纳的论文,担心自己忘了,有点可惜,便想记录在博客上

2 文章列表

202003

Beat the AI: Investigating Adversarial Human Annotations for Reading Comprehension
https://arxiv.org/pdf/2002.00293.pdf

1
本文是对于最近兴起的一种数据标注方法的研究,这种方法的本质是人为的创造或筛选出一些高难度样本,塞给一些模型来进行判断,能够打败所有的模型的样本,将被保存下来。这种方法跟机器学习中的集成学习方法很像,跟普通的集成方法又不太一样,这里关注的是样本的产生,而且是高质量样本的产生,有点返璞归真的意思,又把语言学家的专业知识给利用上了。

2
本文一个有趣的地方在于,一方面用一些弱学习器来标注样本,去提高学习能力顶尖的RoBERT模型的表现。另一方面,采用了学习能力依次递增的强学习器来标注样本,并且观察其中打败AI的那些问题的特性。

3
正如作者所说,本文的研究更多的是对这种标注方法的抛砖引玉,引起自然语言领域的研究人员的注意,本人也很期待有大牛能建立一个中文版本的高难度样本集,研究一下高难度样本能否减少训练所需的数据量,是否能让现有的诸如ERNIE2.0的阅读理解模型能力更强

Training distributed deep recurrent neural networks with mixed precision on GPU clusters
https://arxiv.org/abs/1912.00286

核心问题:本文从硬件选取、模型搭建、分布式计算策略、学习率、损失函数等方面,非常详细的讲解了如何高效使用多达100个GPU进行深度循环神经网络
创新点:本文没有相关工作的部分,贵在务实,从实际的研究工作中部署一个高效的GPU集群的角度,讨论了如何将分布式计算策略、基于混合精度的训练模型结合起来,使得模型的训练速度加快、内存消耗降低,并且模型的表现分数并不会下降。同时,作者还研究了使用参数来对损失函数进行缩放,以此提高模型在集群环境下的收敛速度

研究意义:无论是循环神经网络,还是卷积神经网络,模型的规模越来越大,本文作者所提出的各种技巧,能解决训练过程实际的问题,一方面,能在保证了模型的准确率的情况下减少训练的成本,另一方面,也有助于在当前的资源下,训练更大的模型。

这些技巧主要针对GPU集群环境,但也能给单GPU环境的同学提供参考。

GRADIENT-ADJUSTED NEURON ACTIVATION PROFILES FOR COMPREHENSIVE
INTROSPECTION OF CONVOLUTIONAL SPEECH RECOGNITION MODELS
https://arxiv.org/abs/2002.08125

1
本文的主要工作是参考了人脑进行认知的event-related potential模型来设计一种可视化的工具,用来解释attention-ba

[语法讲义].朱德熙.扫描版.pdf 《现代汉语词类研究》.郭锐.扫描版.pdf 《现代汉语语法研究教程》.陆俭明.扫描版.pdf 一种基于句子分割的文法自动推导算法.pdf 一种细粒度的评价对象抽取及倾向性判别方法.pdf 中文功能组块分析及应用研究.pdf 中文句法语义分析及其联合学习机制研究.pdf 人机对话系统中若干关键问题研究.pdf 从树库的实践看句本位和中心词分析法的生命力.pdf 关于CKY句法分析效率的实验性研究.pdf 关联文法语法分析的并行处理研究.pdf 口语对话系统中的一种稳健语言理解算法.pdf 句法分析树标注集及事件分析.pdf 基于Chart算法的句法分析系统的设计与实现.pdf 基于一种新的合成核的中文实体关系自动抽取.pdf 基于中心驱动模型的宾州中文树库(CTB)句法分析.pdf 基于中文的句法分析系统的研究与实现.pdf 基于二元组合文法的语义知识库构建.pdf 基于动作建模的中文依存句法分析.pdf 基于句法分析与依存分析的评价对象抽取.pdf 基于层次模型的中文句法分析.pdf 基于树库和机器学习的汉语依存句法分析.pdf 基于树库的汉语依存句法分析.pdf 基于概率上下文无关语法的句法分析研究与实现.pdf 基于统计的自然语言处理.pdf 基于自然语言理解的自动应答技术及应用研究.pdf 基于语义的汉语句法分析系统的研究与实现.pdf 基于语料库学习的多主题自动问答系统研究.pdf 基于语法功能匹配的句法分析算法.pdf 机器翻译原理与方法讲义(05)基于句法的统计机器翻译方法.pdf 汉语句子的组块分析体系.pdf 汉语句法分析方法研究.pdf 汉语多重关系复句的关系层次分析.pdf 汉语并列结构的自动识别.pdf 汉语概率型上下文无关语法的自动推导.pdf 统计句法分析建模中基于信息论的特征类型分析.pdf 自然语言处理-句法剖析论文.pdf 自然语言理解的语义分析在产品设计中的应用.pdf 融合丰富语言知识的汉语统计句法分析.pdf 限定领域的基本陈述句句法分析.pdf 面向中文问答系统的问句句法分析.pdf
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值