- 博客(7)
- 资源 (2)
- 收藏
- 关注
原创 终于搞明白了Lucene倒排索引原理和中文分词
<br />输入一篇中文文本后:<br />1. 首先进行中文分词,将一段文本切分成以词为单位的文本<br />2. 对分词后的文本创建Lucene倒排索引<br /> <br />转载文章:《Lucene倒排索引技术》<br /> Lucene是一个高性能的java全文检索工具包,它使用的是倒排文件索引结构。该结构及相应的生成算法如下: <br /><br />0)设有两篇文章1和2 <br /> 文章1的内容为:Tom lives in Guangzhou,I live in Guangz
2011-05-30 17:28:00
3226
原创 今天看完了SWRL:A Semantic Web Rule Language Combining OWL and RuleML
<br /> 今天看完了SWRL,下一步的工作就是着手开始编写自己的规则,我决定尝试Jena规则的书写方法,看起来简洁明了,掌握书写的格式,编写自己的规则语句,达到输出我想要的结果,这是我近两周的目标。<br /> 当规则语句编写成功,我准备撰写一篇一论文。
2010-12-28 11:15:00
4701
2
原创 什么是FRBR,我今天弄明白了
<br />FRBR<br />FRBR is short for Functional Requirements for Bibliographic Records, the title of a document released in 1998 by IFLA, the International Federation of Library Associations. FRBR specifies a data model for organizing bibliographic databases
2010-12-06 15:12:00
5325
1
原创 音乐本体中对work的定义和理解
<br />《荷马史诗》只是一个作品,是一个work,任何一个作品都是抽象的,只有将该作品以某一种形式表现出来才是对作品的体现。比如以诗歌的形式体现,以舞蹈,音乐,歌剧等各种体裁予以表现。所以manifestation和expression是对某一个作品的具体表现。
2010-11-29 10:39:00
490
原创 现在要做的
<br />1. 构建京剧本体<br />2. 按照所构建的本体,生成不同的RDF文件<br />3. 将以上图存储到数据库<br />4. 利用SPARQL对这些文件进行查询
2010-11-29 10:37:00
345
原创 存储到MySQL数据库中的owl文件怎么查看呢?
<br /> 我将ShowRecord.owl文件存储到MySQL数据库中,数据库叫Jena,在Eclipse中创建工程OperaOntology,代码如下:<br /><br />import java.io.*;<br />import java.sql.SQLException;<br />import com.hp.hpl.jena.db.*;<br />import com.hp.hpl.jena.ontology.OntClass;<br />import com.hp.hpl.jena.
2010-11-25 15:10:00
1996
原创 2010年11月24日 我好像有点明白什么是语义网了
今天在尝试构建京剧本体的时候发现了一个问题,继而引发了一系列思考。 第一步,打开Protege,构建一个京剧本体,构建本体时起的名字是http://OperaOntology.owl,然后创建类,对象属性以及数据类型属性。 第二步,我创建了一个类OperaArtists,一个类是Show,一个属性agentIn,该属性用来描述演员参加了某场演出。 第三步,创建OperaArtists的实例,MeiLanFang和ShangXiaoYun,Show类的实例,BeijingOper
2010-11-25 10:10:00
528
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人