最近主要是对研究了结构化数据和半结构化数据的抽取,本文将以王能斌老师数据库教程上的“学生-课程-成绩”数据库schema为例子进行一个简单的抽取。
一、模型与数据schema
数据建模部分使用protege进行,并非本人操作,所以不详细介绍了。建立的模型关系如图所示:
数据库使用的是Mysql,数据库名student_course,三张表分别为:
(1)student表:
(2)course表:
(3)sc表:
外键:
二、抽取工具D2RQ
d2rq的官方文档:http://d2rq.org/
D2RQ 主要包括 D2R Server, D2RQ Engine 以及 D2RQ Mapping 语言。
D2R Server