- 博客(5)
- 资源 (2)
- 收藏
- 关注
原创 coreseek增量索引的实现及定时执行脚本
有这么一种常见的情况:整个数据集非常大,以至于难于经常性的重建索引,但是每次新增的记录却相当地少。一个典型的例子是:一个论坛有1000000个已经归档的帖子,但每天只有1000个新帖子。在这种情况下可以用所谓的“主索引+增量索引”(main+delta)模式来实现“近实时”的索引更新。这种方法的基本思路是设置两个数据源和两个索引,对很少更新或根本不更新的数据建立主索引,而对新增文档建立增量
2013-06-19 16:37:56
1951
原创 coreseek+mmseg实现中文分词
在windows下实现中文分词方法:1,首先下载mmseg,下载地址:http://www.coreseek.cn/opensource/mmseg/;这里我是将下载的文件解压到e/mmseg下;2,修改coreseek/bin/sphinx.conf里的配置文件:charset_dictpath = e:\mmseg\data\ngram_len=0
2013-06-19 15:55:39
879
原创 coreseek实现关键字高亮显示
怎么让搜索出的结果关键字显示,要用到sphinx里的BuildExcerpts方法:在控制器里添加如下代码:control(welcome.php):public function make(){$this->load->helper('sphinxapi_helper');$key=$this->input->post('keyword');$sphinx = new
2013-06-17 10:26:27
1913
原创 coreseek(中文全文搜索)安装和使用(二)
研究了下新的coreseek,发现增加了 sql_field_string字符类型,用于存储全文索引类字段源内容,这样在搜索之后,提取结果集时,不再需要查询一次数据库。配置方式如下:在原配置中增加:sql_field_string = content其余配置和coreseek(中文全文搜索)安装和使用(一)差不多,这里就不说了,不
2013-06-13 18:05:14
719
原创 coreseek(中文全文搜索)安装和使用(一)
Coreseek 是一个可供企业使用的、基于Sphinx(可独立于Sphinx原始版本运行)的中文全文检索引擎,按照GPLv2协议发行。下面是安装流程:1,首先是下载coreseek,下载地址:http://www.coreseek.cn/news/14/54/2,解压到d盘或e盘下,我是解压到e盘下的coreseek文件夹下3,配置文件:把csft_mysql.conf复制至d:\c
2013-06-12 12:02:32
2886
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅