Datafun Talk2021 知识图谱交流会回顾

本文探讨了知识图谱的构建技术,包括少样本和增量关系抽取等挑战,介绍了百度的中文知识标注方法,以及图谱问答在实际场景中的应用。同时,还详细分析了美团大脑在美食领域的知识图谱构建过程及其应用场景。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 知识图谱与图数据库

存成关系型数据可的问题:

知识图谱存储

2. 企业知识图谱构建技术与挑战

少样本关系抽取

增量关系抽取

主动学习

3. 从零样本做中文知识标注与挖掘(百度)

百科知识树(通用知识)

文本标注挖掘(应用百科知识树)

4. 图谱问答在小爱场景的应用

4.1 整体架构

4.2 信息抽取

  1. 关系抽取

吴京主演战狼,吴京也导演了战狼

基于指针网络的关系抽取模型:

PSO模型(先抽取P,再抽取s和o)

两种模型召回,然后接入到判别模型里面进行判断

2. 事件抽取

4.3 图谱问答

· 文法解析

· 槽位提取

· 图谱问答

5. 美团大脑: 美食领域知识图谱构建及应用进展

5.1 标签图谱

数据来源:美团点评的评论内容(非结构化自然语言数据,但是有海量的信息存储其中)

1. 标签挖掘: 更多的类似于属性级的观点抽取,跳字标签,就是属性和观点词中间有上下文。 这里把属性词和修饰词(观点词)都当成ner来抽取。

2. 标签关系

标签同义词挖掘

无监督场景下,加入对比学习。 让相似的样本距离更靠近,不同的样本距离更远。在实验效果上,可以去的类似于sentence bert的效果

标签上下位挖掘

类似于标签同义词挖掘

3. 图谱打标

商户打标(商户和用户打标签关联)

POI兴趣点,一般指地理位置

判别模型:

4. 应用

4.1 知识问答

4.2 补充召回

5. 知识图谱表示学习

把tag和poi都作为节点,表示成向量,边就是二者的相似度。表示出来以后,可以直接计算tag和poi之间的相似度

6. 图谱应用于推荐

5.2 菜品知识图谱构建

  1. schema层

2. 菜名理解

3. 深度学习模型泛化inference

知识挖掘&显式推理

4. 多模态+结构化 预训练&推理

帮助更好的识别菜品信息

query1: 商户标签怎么定的

人工筛选,人工check

query2:同义词负样本怎么构建?

一开始有一些初始overlap数据,进行标注.

后面用模型预测置信度在0.5附近的样本,送给人工标注

query3:标签图谱存储工具

开源的图数据库

query4: 打标工具:

自己搭建

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值