- 博客(6)
- 资源 (7)
- 收藏
- 关注
原创 xapian简介<六>
Xapian之数据读Xapian数据查找的最基本的步骤的伪代码,我以此为例来简单的说下xapian的数据查找。Xapian::Database db(STR_PATH);Xapian::Enquire enquire(db);enquire.set_query(Xapian::Query::MatchAll);Xapian::MSet matches = enquire.get
2016-06-03 14:29:34
2571
原创 xapian简介<五>
1.Xapian之数据写下面我给出xapian最简单的数据写的例子,以这个例子,我们走完数据写的流程。void WriteDB::init(XapianType::Document& tmp){ Xapian::Document docTmp; docTmp.add_value(0, tmp.valueV1); docTmp.add_value(1,
2016-06-03 14:16:43
2365
原创 xapian简介<四>
1. xapian基本概念开篇先聊点相关的基本概念,再说xapian。1.1 IR 信息检索(Information Retrieval) 在信息检索(IR)中,我们企图要获取的项称之为“document”,每一个document是被一个terms集合所描述的。“document”和“term”这两个词汇是IR中的术语,它们是来自“图书馆管理学”的。通常一个document认为是
2016-06-03 14:14:06
1699
1
原创 XAPIAN简介(三)
今天主要介绍的是Xapian::Database这个类。先上图 看上去就很恐怖的吧,我们一点点的说。 首先一切的开始都来自那个include文件夹中的database.h,他的直接实现是在omdatabase.cc中,此外在common文件夹中还有一个database.h这个文件是DataBase的私有类指针的声明,在backends/database.cc中给出了这
2016-04-01 09:34:43
1723
原创 XAPIAN简介(二)
我写这篇文章主要侧重于XAPIAN源代码代码的研究。我会一点点跟大家分享我分析的XAPIAN的几个主要类。 本篇文章跟大家讨论的是Xapian::compactor类,这个类主要用于数据库的压缩数据,具体用法看官方API(https://xapian.org/docs/apidoc/html/annotated.html),这里我主要讲源码的实现。class XAPIAN_VISIBILI
2016-03-31 19:44:39
1363
原创 XAPIAN简介(一)
XAPIAN简介(一)1. IR简介 谈到xapian就得先提基本概念,xapian,lucene是什么?他们这些的本质就是**IR 信息检索(Information Retrieval)**的实现方式。再直白点就是你给我一个关键词,我给你从筛选出一堆你想要的文章。 那就先聊聊信息检索的基本概念,首先我们拿到一篇文章就是要分词,也就是去掉无意义的词。 举个例子: 文件一:Stu
2016-03-31 18:39:37
5388
3
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人