钢铁知识图谱构建与飞机姿态控制技术研究
钢铁知识图谱构建
在知识图谱的开发中,主要有自上而下和自下而上两种方法,这里采用了自上而下的方法。其流程如下:
1. 数据收集与整理
- 从多个数据源收集数据,然后进行手动整理。收集的数据集信息如下表所示:
| 数据集 | 大小 | 类型 |
| — | — | — |
| 钢铁信息 | 734 项 | 文本 |
| 化学成分 | 417 项 | csv |
| 统一编号 | 377 项 | csv |
- 化学成分表记录了钢种的化学成分,统一编号表记录了一种命名方法,常用钢铁信息以文本形式描述了 420 种钢种的性能和材料用途。
2. 本体层设计
- 在特定专业领域,通常依靠人类知识和专家经验来设计知识图谱的本体层。对于常用钢铁知识图谱,根据从数据集中整理出的概念,设计的类本体层次结构如图所示(此处原文有图但无法在文本中展示)。
3. 实例层构建
- 最后一步是构建知识图谱实例层,过程大致如图(此处原文有图但无法在文本中展示)所示,其中有三种不同的方式来提取不同类型的实体,并将提取的实体映射到本体以获得知识图谱。在这个过程中,命名实体提取是最重要的步骤,也是研究的重点。
命名实体识别方法
1. 基于规则的命名实体识别
- 由于信息通常从专业手册、论文和相关网站收集,标点符号和语言表达的使用可以达到工业标准。因此,将标点符号、空格和连词
超级会员免费看
订阅专栏 解锁全文
2160

被折叠的 条评论
为什么被折叠?



