最近做了一段时间关于知识图谱的项目。
知识图谱是一个非常有意思的领域,在这个信息泛滥并且越来越依赖于大数据的时代,知识图谱将会是一个被广泛应用的工具。
但是,在目前的中国,知识图谱的应用还不会很顺利,至于原因,我们可以通过对知识图谱的逐步了解来发现。
目录
知识图谱的理论
网上有很多关于知识图谱的文章,但是很遗憾,现在的人都不太喜欢好好说话,明明很简单的事情,却一定要用一种复杂或者特别的表达方式,也就是所谓的行业黑话。
作为一个实际的应用者,知识图谱对我来说,就是四个字——呈现关系。
找一个角度去观察世界,理解世界,抽象出本体和实体(类似于面向对象中的对象和实例),然后立足于你的角度,找出实体之间的关系。
讲到实体之间的关系,不得不提三元组这个数据结构。
三元组其实也很简单,就是三个字——主谓宾。
比如说地球属于太阳系,那么主语是地球,宾语是太阳系,谓词是属于,那么地球和太阳系之间的关系就是属于,如果主语和宾语反过来,太阳系和地球关系就是包含。
当然,如果你换一个角度去观察太阳系和地球,你也可以得到其他的关系。
在实际应用中,深刻的理解这两个理论概念(知识图谱和三元组)非常重要。
如果都不知道自己在做什么,那你怎么可能做得好呢?方向不对,前进就是倒退。
在当