一、Coreseek简介
Coreseek 是一款中文全文检索/搜索软件,以GPLv2许可协议开源发布,基于Sphinx研发并独立发布,专攻中文搜索和信息处理领域,适用于行业/垂直搜索、论坛/站内搜索、数据库搜索、文档/文献检索、信息检索、数据挖掘等应用场景。
二、coreseek安装
下载coreseek windows版本,解压到 d:\xampp ,修改配置文件csft_mysql.conf ,范例如下
#MySQL数据源配置,详情请查看:http://www.coreseek.cn/products-install/mysql/
#请先将var/test/documents.sql导入数据库,并配置好以下的MySQL用户密码数据库
#源定义
source mysql
{
type = mysql
sql_host = localhost
sql_user = root
sql_pass = root
sql_db = test
sql_port = 3306
sql_query_pre = SET NAMES utf8
sql_query = SELECT id, group_id, UNIX_TIMESTAMP(date_added) AS date_added, title, content FROM documents
#sql_query第一列id需为整数
#title、content作为字符串/文本字段,被全文索引
sql_attr_uint = group_id #从SQL读取到的值必须为整数
sql_attr_timestamp = date_added #从SQL读取到的值必须为整数,作为时间属性
sql_query_info_pre = SET NAMES utf8 #命令行查询时,设置正确的字符集
sql_query_info = SELECT * FROM documents WHERE id=$id #命令行查询时,从数据库读取原始数据信息
}
#index定义
index mysql
{
source = mysql #对应的source名称
path = d:\xampp\coreseek\var\data\mysql #保存索引的目录,请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
docinfo = extern
mlock = 0
morphology = none
min_word_len = 1
html_strip = 0
#中文分词配置,详情请查看:http://www.coreseek.cn/products-install/coreseek_mmseg/
#charset_dictpath = /usr/local/mmseg3/etc/ #BSD、Linux环境下设置,/符号结尾
charset_dictpath = d:\xampp\coreseek\etc\ #Windows环境下设置,/符号结尾,最好给出绝对路径,例如:C:/usr/local/coreseek/etc/...
charset_type = zh_cn.utf-8
}
#全局index定义
indexer
{
mem_limit = 128M
}
#searchd服务定义
searchd
{
listen = 9312
read_timeout = 5
max_children = 30
max_matches = 1000
seamless_rotate = 0
preopen_indexes = 0
unlink_old = 1
pid_file = d:\xampp\coreseek\var\log\searchd_mysql.pid #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
log = d:\xampp\coreseek\var\log\searchd_mysql.log #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
query_log = d:\xampp\coreseek\var\log\query_mysql.log #请修改为实际使用的绝对路径,例如:/usr/local/coreseek/var/...
binlog_path = #关闭binlog日志
}
PS:路径一定要写对,不然会出现各种报错
然后把searchd 安装成服务:
D:\>xampp\coreseek\bin\searchd --install --config d:\xampp\coreseek\etc\csft_mysql.conf --servicename sphinxsearch
三、coreseek测试
首先创建索引
D:\>xampp\coreseek\bin\indexer -all
如果出现以下错误
FATAL: no readable config file (looked in ./csft.conf)
则指定配置文件路径即可:
D:\>xampp\coreseek\bin\indexer --all --config d:\xampp\coreseek\etc\csft_mysql.conf
索引创建成功后,测试搜索:
关键词(test this)
D:\>xampp\coreseek\bin\search --config d:\xampp\coreseek\etc\csft_mysql.conf test this
PS:search 而非 searchd
四、PHP扩展Sphinx安装
下载扩展 地址:http://pecl.php.net/package/sphinx
windows系统要下载相应的dll文件,放到 php/ext 目录下, 在php.ini下加入配置:extension=php_sphinx.dll
即可。查看phpinfo() 是否sphinx 。
参考:
http://sphinxsearch.com/docs/current.html
http://www.cnblogs.com/yjf512/p/3598332.html
http://www.coreseek.cn/docs/coreseek_4.1-sphinx_2.0.1-beta.html