
ElasticSearch
文章平均质量分 86
姜希成
岁月流逝,将来的某时某处,我会在叹息中想起,林间的路分成两股,而我选择了人迹罕至之徒,那一刻起,一切差别已成定铸。
展开
-
ElasticSearch-Ingest Pipeline & Painless Script
脚本缓存:脚本编译的开销较大,Elasticsearch会将脚本编译后缓存在Cache 中。默认5分钟最多75次编译 (75/5m)应用场景: 修复与增强写入数据。内置的 Processors。原创 2024-09-04 09:24:20 · 967 阅读 · 0 评论 -
ElasticSearch-ELK
经典的ELK主要是由Filebeat + Logstash + Elasticsearch + Kibana组成。Logstash 是免费且开放的服务器端数据处理管道,能够从多个来源采集数据,转换数据,然后将数据发送到存储库。Logstash通过管道完成数据的采集与处理,管道配置中包含input、output和filter(可选)插件。整合消息队列+Nginx架构:主要加上了Redis或Kafka或RabbitMQ做消息队列,保证了消息的不丢失。Logstash 配置文件结构。默认是 memory。原创 2024-09-04 09:21:44 · 1559 阅读 · 0 评论 -
ElasticSearch-DSL
source。原创 2024-09-04 09:18:48 · 1187 阅读 · 0 评论 -
ElasticSearch-相关性查询
TF-IDF(term frequency–inverse document frequency)是一种用于信息检索与数据挖掘的常用加权技术。IDF是逆向文本频率 (Inverse Document Frequency):每个检索词在索引中出现的频率越高,相关性越低。TF是词频 (Term Frequency):检索词在文档中出现的频率越高,相关性也越高。相关性(Relevance):搜索的相关性算分,描述了一个文档和查询语句匹配的程度。Lucene中的TF-IDF评分公式。原创 2024-09-04 09:17:48 · 792 阅读 · 0 评论 -
ElasticSearch-数据建模
【代码】ElasticSearch-数据建模。原创 2024-09-03 10:38:11 · 669 阅读 · 0 评论 -
ElasticSearch-聚合性能优化
【代码】ElasticSearch-聚合性能优化。原创 2024-09-03 10:37:38 · 819 阅读 · 0 评论 -
ElasticSearch-聚合操作
不精准的原因: 数据分散到多个分片,聚合是每个分片的取 Top X,导致结果不精准。原创 2024-09-03 10:36:54 · 918 阅读 · 0 评论 -
ElasticSearch-集群架构
配置 Hot & Warm 架构:使用Shard Filtering实现Hot&Warm node间的数据迁移。Cerebro 客户端:可以查看分片分配和通过图形界面执行常见的索引操作。Master eligible nodes 和 Master Node。使用 Shard Filtering 的步骤。为什么要设计 Hot & Warm 架构。两类数据节点,不同的硬件配置。原创 2024-09-03 10:35:11 · 1912 阅读 · 0 评论 -
ElasticSearch-集群读写
【代码】ElasticSearch-集群读写。原创 2024-09-03 10:31:14 · 1212 阅读 · 0 评论 -
ElasticSearch-基础操作
基本概念索引操作创建索引修改索引配置查询索引删除索引文档操作添加(索引)文档:POST和PUT修改文档全量更新增量修改使用_update部分更新使用_update_by_query 更新文档并发场景下修改文档查询文档根据id查询文档条件查询 _searchREST风格的请求URI,直接将参数带过去封装到request body中,这种方式可以定义更加易读的JSON格式删除文档文档批量操作批量写入批量创建文档 create原创 2024-09-03 10:28:55 · 1025 阅读 · 0 评论 -
ElasticSearch-关联关系
【代码】ElasticSearch-关联关系。原创 2024-09-03 10:26:58 · 799 阅读 · 0 评论 -
ElasticSearch-倒排索引 & 文档映射
动态映射:不需要定义Mapping映射(即关系型数据库的表、字段等),在文档写入Elasticsearch时,会根据文档字段自动识别类型,这种机制称之为动态映射。当数据写入 ES 时,数据将会通过 分词 被切分为不同的 term,ES 将 term 与其对应的文档列表建立一种映射关系,这种结构就是 倒排索引。当我们去搜索某个关键词时,ES 首先根据它的前缀或者后缀迅速缩小关键词的在 term dictionary 中的范围,大大减少了磁盘IO的次数。对已有字段,一旦已经有数据写入,就不再支持修改字段定义。原创 2024-09-03 10:25:19 · 1450 阅读 · 0 评论