知识图谱
文章平均质量分 97
兼顾理论和实战
谈笑风生...
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
构建知识图谱-Neo4j
前面几篇博文从理论层面和代码层面讲述了知识图谱中的两个重要环节,实体识别和关系抽取,完成了前两个环节之后(当然,可能需要进行指代消解、实体统一等其他问题),得到了实体和实体之间的关系,下面以案例讲解,如何将前两个环节得到的结果用图关系数据库表示,目前使用较多的主流关系型图数据库就是Neo4j了。Neo4j的安装Neo4j 是目前最流行的图形数据库,支持完整的事务,在属性图中,图是由顶点(Ver...原创 2020-01-14 18:59:12 · 2022 阅读 · 23 评论 -
知识图谱之关系抽取代码实战
上一篇博文讲解了关系抽取的理论部分,了解了关系抽取当前主流的技术方案,但是理论终究是纸上谈兵,下面来点实战。还是拿 瑞金医院MMC人工智能辅助构建知识图谱大赛复赛作为案例啊,因为这个案例很经典啊,竞赛连接,复赛题目是在 Named Entity 给定的基础上,做 Relation 抽取,实体关系类别名称:考虑到代码有点多,这里不好一行行解释,故准备了完整的资料对这块做了详细的解释和说明,包括...原创 2020-01-14 16:49:53 · 8281 阅读 · 11 评论 -
知识图谱之关系抽取
什么是关系抽取?关系抽取又称为信息抽取,旨在从大规模非结构化的自然语言文本中抽取结构化信息,再说的简单直白点就是:从文本中识别实体,并抽取实体与实体之间的语义关系。举个例子:1987年2月15日,赵柯出生在北京市某个区,如果赵柯和北京是两个实体的话,那么返回关系就是:人-出生地。关系抽取任务得到的结果常用于问答系统和知识图谱等应用,是基础且重要的自然语言处理任务。为什么要进行关系抽取?这个问...原创 2020-01-11 21:55:14 · 3929 阅读 · 0 评论 -
知识图谱之NER代码实战
概述本篇博文将以比赛–知识图谱大赛为例,详解命名实体识别的代码部分,大赛旨在通过糖尿病相关的教科书、研究论文来做糖尿病文献挖掘并构建糖尿病知识图谱,分为初赛和复赛,初赛旨在实体识别,复赛重在关系抽取,本文主要讲解实体识别部分。实体类别共十五类,定义如下所示:数据使用 brat 进行标注,每个 .txt 文件对应一个 .ann 标注文件。数据样例0.txt中国成人2型糖尿病HBA1C ...原创 2020-01-10 17:45:09 · 4085 阅读 · 10 评论 -
知识图谱之命名实体识别
本片博文我将讲解两个部分,第一部分讲命名实体识别的发展史,这中间会涉及到整个技术的成熟历程,第二部分讲主流的命名实体识别技术的实现细节。...原创 2020-01-05 17:49:24 · 4036 阅读 · 1 评论 -
知识图谱之理论概述
本篇是知识图谱的开篇,这篇博客,咱不谈技术细节,只谈理论,力求讲明白什么是知识图谱?为什么要做知识图谱?怎么做知识图谱?概论移动互联网的发展已接近瓶颈,5G的时代也即将到来,万物互联已成为了可能,人与人之间、人与物之间、物与物之间都产生了联系,这种互联产生的数据是爆发性的增长,而且这些数据恰好可以作为分析关系的有效原料,个体之间的关系必然成为我们需要深入分析的一部分。在一项任务中,只要有关系分...原创 2020-01-02 23:58:36 · 2084 阅读 · 0 评论
分享