
ElasticSearch
zkq_1986
这个作者很懒,什么都没留下…
展开
-
Term weight algorithm in IR
1 TF-IDF2 BM25f是TD-IDF中的TF,|D|是文档D的长度,avgdl是语料库全部文档的平均长度。k1和b是参数。usually chosen, in absence of an advanced optimization, as k1∈[1.2,2.0]k_1 \in [1.2, 2.0] and b = 0.75 。 b的相关性令: y=1-b+b*x, x表示|D|/原创 2016-08-12 11:36:50 · 1060 阅读 · 0 评论 -
Elasticsearch基本概念
Apache Lucene 相似度评分lucence相似度评分公式: es除了使用上面的默认公式外,还允许用户自定义评分规则。查询重写(query rewrite)es会对模糊查询(前缀匹配、通配符匹配)进行重写,以提高查询效率。看一下例子。 假设有以下文档curl -XPUT 'localhost:9200/clients/client/1' -d '{"id":"1", "name":"原创 2016-07-22 15:28:40 · 358 阅读 · 0 评论 -
Elasticsearch分组聚合-查询
1 统计某个字段下的分组情况类似如下功能: select count(*) from mytable group by myfieldcurl -XPOST 'localhost:19200/ylchou-0-2015-10-07/_search?pretty' -d ' { "size": 0, "aggs": { "group_by_state": {原创 2016-08-31 16:38:08 · 9130 阅读 · 0 评论 -
Elasticsearch集群入门-基本操作
1 启动集群转到bin目录,运行如下命令:./elasticsearch关掉Elasticsearch如果节点是连接到控制台,按下Ctrl+C。第二种选择是通过发送TERM信号杀掉服务器进程(参考Linux上的kill命令和Windows上的任务管理器)。第三种方法是使用REST API。对于第三种方法可以执行以下命令来关掉整个集群:curl -XPOST http://localhost:9原创 2016-07-21 08:35:10 · 529 阅读 · 0 评论 -
【es】es避坑小餐
作者:小猫助手链接:https://www.zhihu.com/question/59957272/answer/170694929来源:知乎著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。大家好,我是黄歆,目前担任斗鱼数据平台部基础架构组Leader,主要负责斗鱼数据平台部基础环境建设(Hadoop、ELK、容器集群等)及基础服务开发(发布系统、监控告转载 2017-08-23 10:29:58 · 972 阅读 · 0 评论