知识图谱目前亟待的问题有哪些?

本文围绕知识图谱展开讨论,指出其面临的挑战,如不同数据源相同实体聚类、知识自动获取、多源知识融合等。还提及知识库构建、存储、应用等方面,包括实体检索、推荐、查询理解和自然语言查询等应用方向。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

张发恩

作为谷歌知识图谱的一个开发工程师,说一点自己的看法。最难也最需要抓紧解决的是 如何将来自不同数据源的相同实体聚类。比如电影数据源里有刘德华,音乐数据源里也有刘德华,这两其实是一个人,从不同数据源构建图谱的时候,必须有自动化的算法将各处的刘德华聚类。这方面谷歌走过弯路,但现在已经走上正路了。大家可以慢慢的感受到谷歌搜索引擎正在变为谷歌知识引擎。Google now很重要的一个基石就是谷歌知识图谱。
知识图谱中还有很多其他挑战,比如文字到实体的映射,但这些都有较成熟的算法。
看到其他人说的存储方面的挑战,这在谷歌里真的不是什么挑战,sstable 和 bigtable轻松愉快。之上跑起 MapReduce, flume不要太爽


刘知远

知识图谱是谷歌对其所推出的大规模知识库产品的称呼。在此之前,已经有关于知识库的大量研究,其中有很多代表性工作,也相应提出了很多挑战性问题。

我认为知识图谱的主要挑战问题包括:1. 知识的自动获取;2. 多源知识的自动融合;3.面向知识的表示学习; 4. 知识推理与应用。

关于知识图谱最近写了一篇短文,可以参考:book.thunlp.org/knowled 。终于算把这个坑填好了。:)


李小瀚


智商是一生的痛

33 人赞同了该回答

这个坑略大啊。。
从知识库的构建开始:通常是从web上的非结构化数据中识别实体、挖掘关系,也就是knowledge extraction了。然后这中间涉及到另一个非常大的坑disambiguation,包括重名和别名,包括实体的消歧、关系的消歧、类别的消歧。当然获取知识的时候也可以借助一些已有的结构化数据,比如wordnet之类的一些ontology。。YAGO就是这么来的

库建好了,就得考虑怎么存了,这个问题比较偏DB和graph,比如直接搞个relational DB来把一个个的三元组存起来,比如搞个graph DB来存,比如搞个RDF engine来存,这方面关注得比较少。

好了,现在库建好了,存了存好了,问题就来了,号称“给计算机装上了大脑” 的knowledge base到底有什么用呢??你搜个刘翔,它可以给你一堆刘翔的介绍。。这就是最简单的实体检索。。but这个太废了。。值不回巨头们的钞票啊。。。

于是有人说了。。我们可以把它用到搜索引擎上啊。。你搜一个刘翔。。我除了给你一个刘翔的百科主页,我还可以告诉你教练孙海平。。父母XXX。。前妻葛天。。做得好的话还能给你推荐个裤裆藏手榴弹的电视剧有木有!!这就是利用知识库来做recommendation

另外有人觉得这玩意儿可以拿来搞query understanding啊。。用来帮着消歧啊有木有!!比如有人搜apple的时候,google和度娘是不知道你想搜水果还是搜乔布斯的。。but当你搜 "microsoft apple"或者"乔大爷 apple"的时候它就兴奋的发现它派上用场了,它知道巨硬跟apple都是公司啊你肯定想找手机啊于是广告就来了啊钱就哗哗了啊

最后,也就是要隆重推出的,也是在本屌有限的知识背景下自认为很有前途很有情怀,当然也很难的,question answering over knowledge base. 说白了就是知识库上的自然语言查询。比如你输一句 "刘翔的前妻的裤裆藏手榴弹的电视剧的名字是什么呀~~", 它能告诉你。。它叫XXX。。这个本质是一个NLP的问题,即如何将一个自然语言查询转换个kb上的结构化查询,这一步是无数指着kb捞钱的人们梦寐以求的。。你想啊有了这技术搜索引擎得多厉害啊。。你问啥告诉你啥。。微软小冰得多厉害啊。。你问啥告诉你啥。。智能机器人得多厉害啊。。你问啥告诉你啥。。。

当然还有很多很多其他。。个人了解有限。。也有很多不甚关注的东东。。想到再补充吧


cstghitpku


Talk is cheap,show me the code!

2 人赞同了该回答

我认为是多源数据的融合最难解决。比如从虾米音乐网挖出“刘德华”,从爱奇艺等影视也挖出“刘德华”,识别出他们代表的是同一个实体,然后融合。菜鸟的观点,不喜勿喷,欢迎大家一起学习讨论

ling0322


战斗力只有5的零

4 人赞同了该回答

大致说几个吧
第一个就是在从网上获取知识后,怎样确保获取知识的准确性,找出不准确的知识然后去掉
第二个就是区别同名的不同实体。比如打乒乓球的刘国梁与文学家刘国梁
第三个就是根据现有的知识推断更多的实体间的关系,比如周杰伦的爸爸周耀中与周杰伦的妻子昆凌的关系就是公公。

知乎用户

2 人赞同了该回答

最终的落脚点还是要有基于行业的本体构建,如农业、军工,如果缺乏本体构建的基础,后面的运算是个大问题。

刘文强

机器学习,知识图谱,深度学习

个人觉得有以下几个方面:

1. 知识图谱的构建方面- 如何从开放的信息中抽取知识图谱所需的实体,以及实体之间的关系。围绕这方面研究主要是entity 和relation extraction 。虽然NLP领域也对这个问题研究了很多年,但是在开放信息源中的效果并不是很理想。典型的研究就是CMU 的Tom Michel 组的NELL。

2. 知识图谱的存储方面。如何存储海量的知识,如何能够有效的更新

3.知识图谱的检索方面。如何给一个自然语言的问题,能够有效的检索相关的答案。

4. 知识图谱的有效推理。小明的老婆的父亲-->小明的岳父

这些问题想想都很困难啊。


大王

但识琴中趣,何劳弦上音

海量知识的存储;不确定性推理



### 回答1: 我们越来越多地把知识图谱作为一种可以提供更好的智能应用的有效工具,它有助于我们更好地理解世界,从而创造出更加准确和有效的智能应用。知识图谱的研究现状表明,它们可以用于实现大规模数据分析,并且已经被广泛应用于不同的领域,包括自然语言处理、语义搜索、机器学习和社交网络分析。此外,知识图谱的研究正在探索如何更好地构建知识图谱,改善知识图谱的性能,以及利用知识图谱实现更复杂的任务。 ### 回答2: 知识图谱是一种以图谱为基础的知识表示和管理方法,用于描述事物之间的关系和属性。它被广泛应用于自然语言处理、智能搜索、推荐系统等领域。目前,知识图谱的研究已经取得了重要进展。 首先,知识图谱的构建是一个关键任务。研究者在构建知识图谱时,通常会从结构化、半结构化和非结构化数据中提取知识,并建立实体之间的关系。常用的知识抽取方法包括基于规则的抽取、基于统计的抽取和基于深度学习的抽取。 其次,知识图谱的应用也日益广泛。例如,知识图谱可以用来构建智能问答系统,通过图谱中的知识关系进行问题解答。它还可以用于推荐系统,通过分析用户和物品之间的关系,提供个性化的推荐。另外,知识图谱还可以用于智能搜索,提高搜索引擎的准确性和效率。 此外,知识图谱的表示与推理也是研究的热点。为了更好地表示和推理知识,研究者提出了多种表示方法和推理模型。例如,基于图神经网络的方法可以将图谱中的实体和关系表示成向量,进而进行推理和预测。 最后,知识图谱的扩充和更新也是一个重要问题。由于知识图谱需要随着新的知识不断更新,研究者提出了一些方法来实现知识图谱的自动化扩充。例如,基于知识补全和迁移学习的方法可以从多个数据源中补全和更新图谱中的知识。 综上所述,知识图谱的研究现状是多样化的。不仅在构建和表示方法上有多种技术可选择,而且在应用领域和知识推理上也有各种方法可以探索。未来,随着人工智能和大数据的发展,我们可以期待知识图谱在更多领域的应用和进一步的研究突破。 ### 回答3: 知识图谱是一种用于描述和组织知识的图形化工具,它通过连接实体之间的关系,展示了知识的结构和规模。目前,知识图谱的研究已经取得了许多重要的进展。 首先,知识图谱的构建方法已经得到了广泛应用和研究。常用的构建方法包括知识工程、自然语言处理和机器学习等。知识工程主要通过人工定义和抽取知识库中的实体和关系;自然语言处理则主要通过文本挖掘和信息抽取等技术从大规模文本中自动抽取知识;机器学习方法则将统计学习算法应用于知识抽取和关系识别等任务。 其次,知识图谱在多个领域的应用也得到了广泛关注。在医疗领域,知识图谱被用于辅助临床决策和医疗知识管理;在金融领域,知识图谱能够帮助发现金融风险和进行投资分析;在智能交通领域,知识图谱则用于交通信息的智能查询和推荐等。知识图谱在这些领域的应用,有效地提升了工作效率和决策能力。 此外,对于知识图谱的研究还涉及到了知识表示和知识推理等方面。知识表示主要研究如何将知识表示为计算机可以理解和处理的形式,使其能够在知识图谱中起到作用;知识推理则是通过推理算法,利用知识图谱中已有的知识,进行新的知识发现和推理推断。 最后,知识图谱的发展也面临着一些挑战。例如,知识图谱的构建过程需要大量的人工参与和辅助,导致成本较高;知识图谱中的知识不断演化和变化,对于知识更新和维护提出了新的要求;同时,知识图谱存在着数据质量和隐私保护等问题。 综上所述,知识图谱的研究已经取得了很多重要的进展,应用领域也日益扩大。然而,仍然有许多问题亟待解决,需要继续进行研究和探索。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值