
ES
海里真的有鱼
每次发版,必把数据库搞炸了的程序员
展开
-
1-安装Elasticsearch
未完待续。原创 2024-08-15 13:32:54 · 313 阅读 · 0 评论 -
关键词搜索里 minimum_should_match 和 multi_match
minimum_should_match 设置99%的话,也是必须命中其中任意一词才符合召回条件(搜索词分出来的词数*最小匹配度百分比后向下取整 得到1)例如搜索词“迈瑞呼吸机” 分出了2个词,minimum_should_match 设置1的话,必须命中其中任意一词才符合召回条件。minimum_should_match 是最小匹配数,可以设置数字也可以设置百分比。multi_match 是跨字段搜索。原创 2024-07-04 17:10:22 · 417 阅读 · 0 评论 -
动态添加同义词和扩展词问题
安装完ik分词插件后,在ik插件的配置文件IKAnalyzer.cfg.xml 里设置远程扩展词地址,扩展词更新后,搜索词实时生效,但是索引里的历史数据必须重刷才能生效,所以数据量小的话可以定期全量重刷,数据量大的话用reindex重建。建索引的时候在settings里设置同义词远程地址 并设置刷新间隔30s,动态添加的同义词30s后生效。原创 2024-07-04 17:04:28 · 245 阅读 · 0 评论 -
ik_smart 和 ik_max_word 如何选择
指标:搜索分词器选哪个:索引分词器选哪个:如何设置搜索分词器和索引分词器原创 2024-07-04 16:55:17 · 217 阅读 · 0 评论 -
ik-7.8.0 阅读源码笔记
ISegmenter是分词器接口,它下面有3个实现类 分别是 中文-日韩文子分词器 中文数量词子分词器 英文字符及阿拉伯数字子分词器。4、下载源码后 config 目录下是ik 自带的词库,主词典,扩展主词典、停止词、副词、量词等。3、同义词地址 是建索引 的时候 在 setting里设置的,未完待续(还没看完),有读过源码的,欢迎在评论区一起讨论研究。5、ik 是怎么实现一个字符串 分成 一个一个的词的?1、ik 是安装在 es 插件目录下的。将要分词的搜索词,经过3个分词器去分词。原创 2024-07-04 16:41:13 · 166 阅读 · 0 评论 -
相关性得分计算公式
原创 2024-07-04 16:19:06 · 403 阅读 · 0 评论 -
explain:true 查看es 相关性得分 是如何计算出来的
原创 2024-07-04 16:18:02 · 365 阅读 · 0 评论 -
es 清除查询出来的文档
原创 2024-07-04 16:10:52 · 111 阅读 · 0 评论 -
查看和取消任务http://xxxxx:9200/_tasks/Doh6WMb3TLyinndekte6KA:39938 http://xxxxx:9200/_tasks/任务id
通过上述请求获取执行结果,包含完成结果,总文档数,创建文档数,更新文档数,耗时。reindex 分批执行后返回任务id。原创 2024-07-04 16:04:22 · 393 阅读 · 0 评论 -
post http://xxxxx:9200/_reindex?wait_for_completion=false 用法和生产速度
将符合条件的数据从invite_tender_p 复制到 zhao_tou_biao_p 索引里,分批复制,每批5000,同时zhao_tou_biao_p 里的文档id 用invite_tender_p 的infoId。使用场景:es 字段已经创建无法动态修改分词器,也无法动态修改 setting.当想修改分词器和setting的时候使用。生产340w 数据19G 需要89分钟。原创 2024-07-04 16:01:39 · 210 阅读 · 0 评论 -
ES 经典200个问题
ES 经典200个知识点原创 2023-08-14 09:25:35 · 3583 阅读 · 0 评论