第一天是sphinx的安装,第二天是sphinx工具的使用,今天就讲一下conf的配置,明天准备说说程序中如何调用,后天再准备谈一下sphinx的工作原理。
废话少说,直接看下我机器中sphinx.conf中的默认配置
cat /usr/local/coreseek/etc/sphinx.conf|grep -v '^$'
source src1
{
type = mysql
#数据类型,必须选项。常用的是:mysql,pgsql,mssql,xmlpipe,odbd,python
sql_host = localhost
#数据库服务器,必须选项,仅对mysql,pgsql,mssql有效。注意:localhost使之强制使用socket连接;127.0.0.1会强制使用TCP/IP
sql_user = root
#数据库用户名为root
sql_pass =
#数据库密码为空
sql_db = test
#数据库名称是test库
sql_port = 3306
#数据库端口为3306
sql_query = \
#获取待索引数据查询
SELECT id, group_id, UNIX_TIMESTAMP(date_added) AS date_added, title, content \
FROM documents
sql_attr_uint = group_id
#声明无符号整数属性
sql_attr_timestamp = date_added
#声明时间戳属性
sql_query_info = SELECT * FROM documents WHERE id=$id
}
index test1
{
source = src1
#配置test1的文档源为src1,即是上面的大括号里的内容(主要为sql_query=...的内容)
path = /usr/local/coreseek/var/data/test1
#索引文件路径
docinfo = extern
#文档信息存储模式,默认是extern.其他的模式:none,inline
charset_type = sbcs
#字符集编码为sbcs(默认值),常用的如:uft-8
}
index testrt
{
type = rt
#索引类型为实时索引;其他的如plain(普通本地索引,默认为plain),distributed(分布式)
rt_mem_limit = 32M
#rt索引内存限制为32M
path = /usr/local/coreseek/var/data/testrt
charset_type = utf-8
rt_field = title
#全文字段定义,多值选项,必须设置。上面为title,下面为content
rt_field = content
rt_attr_uint = gid
#无符号整数属性定义
}
indexer
{
mem_limit = 32M
#索引内存限制为32M(默认值),最大可为2047M,太小的话会影响索引速度
}
searchd
{
listen = 9312
listen = 9306:mysql41
#指定searchd监听的IP地址和端口,或socket路径,可以有多个
log = /usr/local/coreseek/var/log/searchd.log
#搜索系统日志,即全部searchd运行时事件记录日志
query_log = /usr/local/coreseek/var/log/query.log
#搜索查询日志,即全部查询记录日志
read_timeout = 5
#远程读取超时时间为5秒
max_children = 30
#并行执行的搜索数目为30
pid_file = /usr/local/coreseek/var/log/searchd.pid
#PID文件,必须项,用来检查是否已有一个searchd;停止searchd;通知searche轮换索引等。
max_matches = 1000
#最大返回匹配数是1000
seamless_rotate = 1
#启用无缝轮换
preopen_indexes = 1
#启用索引预开启
unlink_old = 1
#旧索引清理,即索引轮换后删除以.old的索引拷贝
workers = threads # for RT to work
#处理模式为threads模式,其他有none,fork,prefork,mpm
}
默认的配置文件已经解释完,实际使用中常常会有sql_query_pre(待索引数据获取前查询)比如:
sql_query_pre=SET NAMES uft8
sql_query_pre=SET SESSION query_cache_type=OFF
好了,conf的简单配置的解释,我已经插入sphinx.conf中,后期还会有新的研究。
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/29806344/viewspace-1397578/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/29806344/viewspace-1397578/