《FL-MSRE: A Few-Shot Learning based Approach to Multimodal Social RelationExtraction》
先了解few-shot learning: 理解1,理解2数据集构建因为为图片数据集补充文本很困难,因此考虑为文本数据集补充图片。句子:提取至少提到两个人的句子,并至少两个人支持图片:提取至少包含两个人的image只保留细粒度的关系。如family(no),father(yes)最后将数据集分为三部分:DRC-TF(15 rels),OM-TF(9 rels),FC-TF(24 rels)。Every social relation is supported by multiple tri
原创
2021-04-19 11:08:33 ·
875 阅读 ·
0 评论