首先知识图谱是指在描述真实世界存在的各种实体及其关系
通用知识图谱:
Google所提出的知识图谱是面向全领域通用的知识图谱,主要用于面向互联网的搜索、推荐、问答等业务场景,强调的是广度,因而强调更多的是实体,很难形成完整的全局性的本体层的统一管理。
语言学类:wordnet
MIT-ConcepNetb的中文部分
汉语开放词网
百科类: DBpeida
中文通用百科知识图谱
zhishi.me
DKU-PIE知识图
行业知识图谱:
指面向特定领域的知识图谱,因用户目标对象要考虑行业中各级别人员,所以要一定的深度,与完备性。行业知识图谱的准确率要求非常高,通常用于辅助各种复杂的分析应用或决策支持。有严格与丰富的数据模式,行业知识图谱中的实体通常属性比较多且具有行业意义。
行业知识图谱的意义:
数据来源多:
内部数据、互联网数据、第三方数据
数据类型多:
包括结构化,半结构化,非结构化数据且具后两者越来越多。
数据模式无法确定:
模式在数据出现之后才能确定,数据模式随数据增长不断演变。
数据量大:
在大数据背景下,行业应用的数据的数量通常都以亿级别计算,存在通常TB,PB级别或更多。
行业知识图谱应用:
金融证券、生物医疗、图书情报、电商、农业、政府、电信、出版
通用知识图谱+行业知识图谱——>相互补充,更完善的知识图谱
企业知识图谱的应用——企业风险评估:
利用图计算等方法构建科学、严谨的企业风险评估体系,有效规避潜在的经营风险与资金风险。
企业社交图谱查询
基于投资、任职、专利、招标以目标的企业为核心向外层扩散,形成一个网络关系图,直观立体的展现企业关联。
企业最终控制人查询
基于股权投资关系,寻找持股比例最大的股东,最终追溯至自然人或图有资产管理部门。
企业之间路径发现
基于股权、任职、专利,招标税收等。
医疗知识图谱:
中药知识平台
生物医疗:
WASTON辅助诊断治疗
OPenPHACTS部分药物发现
知识图谱行应用----其他行业
农业---->识别作物危害
政府行业---->政府大数据管理
知识图谱基础技术规范
RDF:是语义网标准的第一层
- Resource:页面,图片,视频等任何工具有URI标识符
- DesoriPtion:属性,特征和资源之间的关系
- Franework:模型,语言和这些描述的语法