
relation extraction
文章平均质量分 81
YJII
这个作者很懒,什么都没留下…
展开
-
小样本关系分类:STAD: Self-Training with Ambiguous Data for Low-Resource Relation Extraction Extraction
对于模型在无标注数据集的预测结果,根据预测概率分为3部分,置信度比较高,置信度中等的和置信度较低的。使用自训练方式,self training,利用人工标注数据训练一个teacher model,让labeled data 和置信度高的data训练一个student model。标签体系:采用软标签,partial label,概率最低的label为反标签,之后,概率相当的标签作为正标签。如图2所示,常用的自我训练的流程是按以下步骤进行的。模糊数据集的训练:使用的是negtive training的方式,原创 2022-10-10 20:27:58 · 459 阅读 · 0 评论 -
刘鹏飞_2022_reStructured Pre-training
整个IE经过的发展时期:是不是大约每10年经过一轮变更?不对,变更的时间在不断的缩减。传统机器学习的时代在2011年左右接近尾声,之后,深度学习时代,18年,bert出现,开始转入模型结构时代,21年,提示学习开始崭露头角,22年,回归数据,数据结构化再次被关注。论文中的原话是:数据的作用将被再次强调,模型的预训练和下游任务的微调被看作是一个数据存储和访问的过程。技术的迭代总是沿着这样的方向发展,即系统开发者可以通过做更少的事情来设计一个更好和更普遍的系统。原创 2022-10-10 18:31:03 · 380 阅读 · 0 评论