定义:只要包含两个Entity的句子,都在描述同一种关系。
用途:主要用来为关系分类任务扩充数据集。
优点:能够很快速地为数据集打上标签
缺点:它假设只要包含两个Entity的句子,都在描述同一种关系,这个假设会产生很多地错误标签。可能这两个Entity这是与某个主题有关。 因此往往还需要用一些过滤的方法去筛选出对关系分类有用的句子,比如sentence-level Attention。
Distant Supervision——远程监督
最新推荐文章于 2025-11-13 19:41:21 发布
本文介绍了一种通过识别包含两个实体的句子来快速构建关系分类数据集的方法,这种方法虽然能高效打标但也存在误标风险,需结合过滤手段如sentence-level Attention等进一步优化。
6523

被折叠的 条评论
为什么被折叠?



