知识图谱与语言预训练_biji

wang2008start

已于 2022-06-03 16:55:29 修改

阅读量561

点赞数 1

CC 4.0 BY-SA版权

分类专栏：知识图谱深度学习自然语言处理文章标签：自然语言处理深度学习

于 2020-12-19 17:47:27 首次发布

本文链接：https://blog.youkuaiyun.com/wang2008start/article/details/111408064

本文探讨了ERNIE如何通过结合Wikipedia和WikiData增强语言表示，以及COMET如何使用Commonsense Transformers自动构建知识图谱。此外，还提到了其他如KnowBERT、WKLM和K-Adapter等模型在知识注入和预训练语言表示方面的研究。这些方法旨在通过融合知识图谱信息提升预训练模型的性能。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

ERNIE: Enhanced Language Representation with Informative Entities. (ACL 2019), Wikipedia作为文本语料输入，WikiData作为知识图谱输入。底层模型对于文本进行建模，高层模型对于知识信息进行整合。
COMET : Commonsense Transformers for Automatic Knowledge Graph Construction.ACL2019
KnowBERT:Knowledge Enhanced Contextual Word Representations. (EMNLP 2019)
WKLM: Pretrained Encyclopedia: Weakly Supervised Knowledge-Pretrained Language Model. (ICLR 2020). 弱监督方式，给定文本链接到wikidata，将部分文本进行替换，训练时预测文本是否被替换，loss为交叉墒
K-Adapter: Infusing Knowledge into Pre-Trained Models with Adapters. (2020)
KEPLER: A Unified Model for Knowledge Embedding and Pre-trained Language Representation. (TACL2020)