
Clucene
文章平均质量分 77
ren062
jeayi,时刻改变现在的自己
展开
-
CLucene数据类型
数据类型所占字节长度(字节)说明Byte1基本数据类型,其他数据类型以此为基础定义UInt32432位无符号整数,高位优先UInt64864位无符号整数,高位优先VInt不定,最少1字节转载 2009-04-23 21:06:00 · 1140 阅读 · 0 评论 -
larbin中线程相关 pthread_cond_wait() 函数
larbin时看到线程相关的方面,觉的篇还是比较好理解的,转了过了 出处http://blog.chinaunix.net/u1/53448/showart_431857.html题目POSIX多线程中的pthread_cond_wait() 函数 由于工作站软件的移植牵涉到这方面的内容, 搜一最近一直在学习Linux线程方面的知识!由于这本书上没有将条件变量的问题,所以不能理解的转载 2009-09-08 19:39:00 · 754 阅读 · 0 评论 -
Clucene的网络爬虫 larbin学习网址收集
吴昆的博客 个人感觉比较好 对学习larbin很有帮助 http://hi.baidu.com/hustwk/blog/category/larbin%D3%EB%C5%C0%B3%E6 青青子衿的博客 有文件的分析,可能版本不同,看看还是有价值的 http://blog.youkuaiyun.com/anzijin/archive/2009/01/07/37265原创 2009-05-03 16:32:00 · 2229 阅读 · 0 评论 -
clucene C++网络爬虫分析及比较 (未完)
在SourceForge.net中,java的网路爬虫比较多,C++的比较少,下面几个是与C++的有关的网络爬虫(spider,crawler) Universal Information Crawler http://sourceforge.net/projects/uicrawler/ (C++) URL Web Crawler http://sourceforg原创 2009-05-01 12:30:00 · 4071 阅读 · 1 评论 -
Clucene 几种中文分词以及比较(未完)
CJKAnalyzer、ChineseAnalyzer以及LACE (Lucene compatible Analyzer)http://lucene.apache.org/ 以及 http://sourceforge.net/projects/zhongwenfenci/ 通过分析,CJKAnalyzer、ChineseAnalyzer 与 Clucene的analysis目录下的有原创 2009-04-27 22:00:00 · 2043 阅读 · 1 评论 -
clucene 搜索类型以及相关文件
索引index>段segment>文档document>域field>项term 倒排索引 布尔查询相关文件(Boolean Search) AND, OR, NOT, 加(+), 减(-) BooleanQuery.cpp BooleanQuery.h 通配符搜索(Wildcard Search) 两种通配符:问号(?)和星号(*)。 Wi原创 2009-04-26 09:25:00 · 1372 阅读 · 0 评论 -
clucene-core-0.9.21b/src/demo Statistics.cpp分析
#include "stdafx.h"#include "CLucene.h"#include "CLucene/index/Term.h"#include "CLucene/index/SegmentTermEnum.h"#include using namespace std;using namespace lucene::analysis;using na原创 2009-04-25 22:31:00 · 713 阅读 · 0 评论 -
clucene 文件结构(未完 有待修改)
索引index>段segment>文档document>域field>项termclucene数据类型 http://blog.youkuaiyun.com/ren062/archive/2009/04/23/4104769.aspx 块文件结构(segment) SegmentInfos.h 域文件结构(field) 项原创 2009-04-26 14:41:00 · 1316 阅读 · 1 评论 -
clucene-core-0.9.21b/src/demo SearchFiles.cpp
#include "stdafx.h"#include "CLucene.h"#include using namespace std;using namespace lucene::analysis;using namespace lucene::index;using namespace lucene::util;using namespace lucene原创 2009-04-25 22:33:00 · 930 阅读 · 0 评论 -
clucene-core-0.9.21b/src/demo DeleteFiles.cpp分析
#include "stdafx.h"#include "CLucene.h"#include using namespace std;using namespace lucene::index;using namespace lucene::util;using namespace lucene::store;using namespace lucene::d原创 2009-04-25 22:27:00 · 843 阅读 · 0 评论 -
clucene-core-0.9.21b/src/demo main.cpp分析
#include "stdafx.h"#include "CLucene.h"#ifdef _CLCOMPILER_MSVC#ifdef _DEBUG #define CRTDBG_MAP_ALLOC #include #include #endif#endif#include using namespace std;//删除文件void DeleteFiles(const cha原创 2009-04-25 22:24:00 · 1140 阅读 · 0 评论 -
简单得判断图片文件类型的代码
一般情况只要看图片文件后缀,就可以知道该图片是什么格式但有些特殊情况,当一个图片文件后缀不可知的时候想要知道一个图片文件的类型(有BMP JPEG GIF 等等)现在有很多开源的库的可以判断文件的类型,有时候想想不需要那么多的代码就可以判断下面的代码可以知道,原理应该是这样,代码未经测试 int fh; long len; //得到内容长度 fh = _o原创 2009-10-21 20:43:00 · 1240 阅读 · 0 评论