
sphinx
文章平均质量分 61
tesgoo
这个作者很懒,什么都没留下…
展开
-
Sphinx 搜索性能优化
MySQL、Sphinx及许多数据库和搜索引擎中的查询是单线程的。比如说,在一台32个CPU核心、16个磁盘的R910服务器上执行一个查询,它最多只会用到一个核心和一个磁盘。没错,只会使用一个。如果查询是CPU密集型作业,那么会使用大约3%的整机CPU能力(以上述32核机器为例)。如果是磁盘密集型,则大约会使用6%的整机IO能力(也是与上例同样的配置,16个磁盘组成RAID10或RAID0转载 2014-04-17 22:58:44 · 1369 阅读 · 0 评论 -
sphinx api 合并查询应用
//参数筛选//筛选cat_id=2$cl->SetFilter("cat_id",array(2));//仅在id为1、3、7的子论坛中搜索$cl->SetFilter("forum_id",array(1,3,7));//范围筛选//筛选发布时间为今天,参数为int时间戳$cl->SetFilterRange("starttime",123,124);//筛转载 2015-09-09 15:37:44 · 1360 阅读 · 0 评论 -
sphinx SPH_MATCH_EXTENDED2 基本应用
匹配模式有如下可选的匹配模式:SPH_MATCH_ALL, 匹配所有查询词(默认模式);SPH_MATCH_ANY, 匹配查询词中的任意一个;SPH_MATCH_PHRASE, 将整个查询看作一个词组,要求按顺序完整匹配;SPH_MATCH_BOOLEAN, 将查询看作一个布尔表达式SPH_MATCH_EXTENDED, 将查询看作一个CoreSeek/Sphinx内部查询转载 2015-09-09 15:36:08 · 4398 阅读 · 0 评论 -
sphinx setOverride 思考
SetOverride (设置临时属性值覆盖) 个性化设置原型: function SetOverride ( $attrname, $attrtype, $values )设置一个临时的(只对单个查询有效)针对不同文档的属性值覆盖。只支持标量属性。$value是一个哈希表,他的键是要覆盖属性的文档ID,之是对应该文档ID的要覆盖的值。于版本0.9.9-rc1引入。属性覆盖特性使用原创 2015-09-09 15:56:07 · 722 阅读 · 0 评论 -
sphinx分布式配置
单机配置请参考搭建coreseek(sphinx+mmseg3)详细安装配置+php之sphinx扩展安装+php调用示例 分布式配置很简单,只需要将局域网内的机器连接即可。vi /usr/local/coreseek/etc/csft.conf[php] view plaincopyprint?index dist { type转载 2015-08-19 21:17:36 · 526 阅读 · 0 评论 -
sphinx分布式索引简介
sphinx分布式索引原理: 当searchd收到一个对分布式索引的查询时,它做如下操作:1. 连接到远程代理2. 执行查询3. (在远程代理执行搜索的同时)对本地索引进行查询4. 接收来自远程代理的搜索结果5. 将所有结果合并,删除重复项6. 将合并后的结果返回给客户端在应用程序看来,普通索引和分布式索引完全没有区别。任一个searchd实例可以同时做为主控端转载 2015-08-19 21:27:23 · 1855 阅读 · 0 评论 -
Sphinx多线程分布式搜索
Sphinx多线程分布式搜索Sphinx分布式索引单机器的分布式索引(单机上同时查询多个索引):index sitese01 { type = distributed local = chunk1 local = chunk2 local = chunk3 local = chunk4}多机器分布式索引(对应用透明,可以让主节点仅转载 2015-08-19 21:42:50 · 2150 阅读 · 0 评论 -
sphinx 配置文件全解析 参数说明
sphinx的配置文件是在配置的时候最容易出错的了:我们先要明白几个概念:source:数据源,数据是从什么地方来的。index:索引,当有数据源之后,从数据源处构建索引。索引实际上就是相当于一个字典检索。有了整本字典内容以后,才会有字典检索。searchd:提供搜索查询服务。它一般是以deamon的形式运行在后台的。indexer:构建索引的服务。当要重新构建索引的时候,转载 2015-08-19 21:38:42 · 1637 阅读 · 0 评论 -
关于多属性查找问题的sphinx解决方案
转自http://www.cnblogs.com/littlehb/p/3667821.html需求描述mysql中,每一个文档都有多个标签,查询时可以筛选一个标签也可以筛选同时拥有多个标签的文档。数据示例文档 标签1 1,2,3,4,52 2,3,4,5,63 3,4,5,6,7转载 2015-09-11 18:40:40 · 1735 阅读 · 0 评论 -
Linux下CoreSeek的安装测试【官方】
CoreSeek快速安装:为了方便学习,转,并感谢http://www.coreseek.cn/products-install/install_on_bsd_linux/安装前,建议查看:源码包说明README;4.0/4.1版可参考3.2版本安装,步骤相同;如遇到问题,请看详细安装说明。##下载coreseek:coreseek 3.2.14:点击下载、coreseek 4.0转载 2015-09-22 11:27:24 · 1826 阅读 · 0 评论 -
使用搜狗词库制作mmseg自定义词典
http://blog.atime.me/note/mmseg-custom-dict.html总结使用搜狗词库制作mmseg词典的方法和步骤。另外,最近一直没写新博客,一方面是因为懒,另一方面是确实没什么可写的。coreseek的介绍和安装説明可参考这里,不再赘述。以下是接下来需要注意的几点:下面假设libmmseg安装于/usr/local/mmseg3目录生成的mmseg转载 2015-09-21 13:44:58 · 1060 阅读 · 0 评论 -
使用搜狗词库制作mmseg自定义词典
为了学习方便转自:http://blog.atime.me/note/mmseg-custom-dict.html 感谢搜狗词库地址:http://pinyin.sogou.com/dict/总结使用搜狗词库制作mmseg词典的方法和步骤。另外,最近一直没写新博客,一方面是因为懒,另一方面是确实没什么可写的。coreseek的介绍和安装説明可参考这里,不再赘述。以下是接下转载 2015-09-22 09:53:09 · 796 阅读 · 0 评论 -
为coreseek添加mmseg分词
由于在工作中遇到了林书豪这个词,原来的分词库里面没有就找了下文档,自己整理了一份,以交流备忘。 1.准备好需要添加的词表,一般都是每行一词,注意要保存为utf-8; 例如: -- 林书豪 -- 2.利用UltraEdit的查找替换功能,使词表格式符合mmseg的要求; 例如: 打开UltraEdit的正则替换功能,将“^转载 2015-09-22 16:54:44 · 1074 阅读 · 0 评论 -
LibMMSeg
转自:http://www.coreseek.cn/opensource/mmseg/#coreseek_mmseg_complex 感谢,为了方便学习LibMMSeg 简介LibMMSeg 是Coreseek.com为 Sphinx 全文搜索引擎设计的中文分词软件包,其在GPL协议下发行的中文分词法,采用Chih-Hao Tsai的MMSEG算法。MMSEG: A Word Id转载 2015-09-22 17:59:11 · 971 阅读 · 0 评论 -
Solr与Sphinx的比较
Solr与Sphinx的比较Solr版本:4.8.1Coreseek版本:3.2.14 (基于Sphinx 0.9.9 release)1.索引效率 Sphinx:10-15MB/秒, 实测最高可对100GB的文本建立索引,单一索引可包含1亿条记录 Solr:10MB/秒,亿条数据,20G索引,新浪目前也采用lucene检索2.搜索性能 Sp转载 2015-10-27 16:31:46 · 626 阅读 · 0 评论 -
sphinx 文档,思路,方法 整理
1多种数据源ID重复问题处理思路: 1.1修改文档ID,将源ID编码进去:source src1{ sql_query = SELECT id*10+1, ... FROM table1 ...}source src2{ sql_query = SELECT id*10+2, ... FROM table2 ...} 1.2将数据来源存储为一个属性原创 2015-10-15 17:57:57 · 758 阅读 · 0 评论 -
coreseek索引更新机制 (如果没有文档被索引,则$maxid会设置为0)
coreseek索引更新机制版权声明:转载时请以超链接形式标明文章原始出处和作者信息及本声明http://fatal.blogbus.com/logs/45153968.html = =,昨晚太晚睡觉,所以日记又没写。结果现在又不太记得昨天做了啥了。还是先说今天吧。今天的时间都花在coreseek的索引更新机制上了,原来是每隔一分钟更新增量索引,每天再重建一次索引。sph_原创 2015-08-31 17:05:17 · 601 阅读 · 0 评论 -
Sphinx+Scws 搭建千万级准实时搜索&应用场景详解
目标:一、搭建准确的千万级数据库的准实时搜索(见详情)二、实现词语高亮(客户端JS渲染,服务器端渲染,详见7.3)三、实现搜索联想(输入框onchange,ajax请求搜索,取10条在层上展示方可)四、实现词库管理(仅需管理scws下的自定义词库dd.txt即可)五、实现全文搜索(提供了两种方案,详见8)案例:本文第五部分,针对实际应用场景,典型案例分析。软件:转载 2015-08-26 19:30:29 · 1246 阅读 · 0 评论 -
php sphinx 高效率搜索引擎搭建(一)
本文主要介绍Sphinx的入门使用,新手观看,老鸟指正!* 1、简介* 1.1.Sphinx是什么* 1.2.Sphinx的特性* 1.3.Sphinx中文分词* 2、安装配置实例* 2.1 在GNU/Linux/unix系统上安装o 2.1.1 sphinx安装o 2.1.2.sfc安装(见另文)o 2.1.3.coreseek安装(见另文)* 2.2 在转载 2014-04-09 22:51:49 · 922 阅读 · 0 评论 -
sphinx配置文件详解
sphinx的配置:其结构组成主要如下:Source 源名称1{ //指定数据源一些配置}Index 索引名称1{Source=源名称1}Source 源名称2{一些配置}Index 索引名称2{Source=源名称2}Indexer{mem_limit = 32M}Searchd{转载 2014-04-10 22:51:56 · 622 阅读 · 0 评论 -
sphinx使用说明
包括搜索和更新状态两个功能使用。原创 2014-04-26 10:26:53 · 1352 阅读 · 0 评论 -
sphinx/coreseek如何及时删除索引里的数据呢
大家应该都知道,使用sphinx或coreseek来做搜索时,除了sphinx2.0开始支持‘实时索引’外,我们使用增量索引时,出现的问题往往是删除后的数据展示问题的了。(新增的话,可以使用增量索引实现近乎实时的功能)。当我们删除数据时,sphinx需要等到更新索引文件时,才会更新。而我们的索引文件不可能实时更新的。所以就造成搜索出来的数据经常不存在的了。解决这个问题,除了实时索引外,其实转载 2014-06-13 16:12:30 · 2112 阅读 · 0 评论 -
coreseek(sphinx)错误:WARNING: attribute 'id' not found - IGNORING原因及解决方法
coreseek(sphinx)错误:WARNING: attribute 'id' not found - IGNORING原因及解决方法coreseek(sphinx)建立索引时提示错误:WARNING: attribute 'id' not found - IGNORING原因:sphinx不能使用主键来做属性字段,你的索引配置文件中一定用了类似sql_attr_uint转载 2015-01-26 10:50:33 · 2773 阅读 · 0 评论 -
sphinx中文分词coreseek在linux下的安装、配置以及使用方法(入门菜鸟级)
最近为公司的项目做分词搜索,于是安装coreseek。但是本人之前只是使用过,根本没有安装过呀,搞个JJ啊。没办法,牛B已经吹了,只能吹爆。开始在网上找安装教程,发现其实就两篇可用,一篇是官网上的,但是他后面的配置讲得不全,另一篇的安装部分跟官网是一样的,但是他把后面的配置也讲了,于是开始安装,我的安装步骤如下:1、安装支持的工具,(用yum非常方便,安装过程中如果碰到有什么Waring:转载 2015-01-26 11:40:06 · 1138 阅读 · 0 评论 -
Sphinx + PHP + scws构建MySQL准实时分布式全文检索
Sphinx全文检索Sphinx安装安装Sphinx:# yum install expat expat-devel# wget -c http://sphinxsearch.com/files/sphinx-2.0.7-release.tar.gz# tar zxvf sphinx-2.0.7-release.tar.gz# cd sphinx-2.0.7-releas转载 2014-04-17 22:51:54 · 1335 阅读 · 0 评论 -
coreseek 的基本操作
重新索引:/usr/local/coreseek/bin/indexer -c /usr/local/coreseek/etc/viewspot.conf --all索引完之后启动searchd:/usr/local/coreseek/bin/search -c /usr/local/coreseek/etc/csft.conf "波音飞机博物馆"/usr/local/cor原创 2015-01-27 15:25:39 · 1079 阅读 · 0 评论 -
sphinx的安装配置和中文分词包coreseek
http://blog.youkuaiyun.com/ownfire/article/details/39316743sphinx在此处下载:http://sphinxsearch.com/downloads/release/本次我下的是2.2.4版本自持中文分词的包叫做coreseek,其实就是带了中文分词插件的sphinx,在此处下载:http://www.core转载 2015-04-22 13:43:50 · 742 阅读 · 0 评论 -
Sphinx SetGeoAnchor 经纬度查找附近地点
Sphinx 的 SetGeoAnchor方法,(LinkWith:http://sphinxsearch.com/docs/manual-0.9.9.html#api-func-setgeoanchor) coreseek提供的中文翻译手册: function SetGeoAnchor ( $attrlat, $attrlong, $lat, $long ) 为地表距离计算设置锚点,转载 2015-04-07 17:52:20 · 1040 阅读 · 0 评论 -
Coreseek中自定义mmseg分词
http://www.pangxieke.com/linux/673.html#respond因为项目需要使用中文搜索,觉得使用coreseek实现,其中使用mmseg 分词库但是mmseg原词库不适合电商项目,所以决定自定义分词库。1.下载搜狗词库,例如有淘宝专用词库 http://pinyin.sogou.com/dict/detail/index/22416,转载 2015-04-17 17:47:02 · 1284 阅读 · 0 评论 -
更新sphinx 索引属性方法 -UpdateAttributes 使用
//sphinx把商品上架(deleted为0) public static function upProSphinx($proid) { $sphinxclient = new SphinxClient (); $sphinxclient->UpdateAttributes ( "products", array("deleted"), array($proid=>array(0))原创 2015-06-25 22:09:30 · 3355 阅读 · 1 评论 -
Sphinx多线程分布式搜索
http://www.zrwm.com/?p=5393Sphinx多线程分布式搜索Sphinx分布式索引单机器的分布式索引(单机上同时查询多个索引):index sitese01 { type = distributed local = chunk1 local = chunk2 local = chunk3 local转载 2015-06-07 22:16:16 · 894 阅读 · 0 评论 -
sphinx –rotate机制详解
今日,发现sphinx出现 sphinx.new.sp*诸多文件。出现这样的情况是因为 searchd没有加载新索引文件。遂Google之,到sphinx官网论坛后得知rotate的机制后方解决!sphinx的searchd在启动时会创建一个 .spl 锁文件,并在关闭时会删除它。在indexer创建索引时如果发现有 .spl文件,则不会创建新索引,因为这时已经标志sphinx正在运行中,除非转载 2015-07-28 14:30:17 · 732 阅读 · 0 评论 -
浅析关于PHP中Sphinx长连接问题
SphinxClient::open(PECL sphinx >= 1.0.3)SphinxClient::open — 建立到搜索服务端的持久连接说明public bool SphinxClient::open ( void )建立到搜索服务端的持久连接.参数此函数没有参数。返回值成功时返回 TRUE, 或者在失败时返回 FALSE.今日在做PHP系统转载 2015-08-26 18:39:59 · 571 阅读 · 0 评论 -
s-phinx 搜索
/** * s-phinx 搜索 * @param $currentPage 页码 * @param $pagesize 个数 * @param string $keyword 查询词 * @param string $topicArr 话题 * @param string $type addtime 按时间排序 heat按热度排序 * @param string转载 2016-04-21 13:59:58 · 628 阅读 · 0 评论