
ES
文章平均质量分 66
es实战教程
冲上云霄的Jayden
这个作者很懒,什么都没留下…
展开
-
Elasticsearch 统计订单销售高峰时间段
如果已销售100w为高峰,由此推断销售高峰期是 20-23点,其次是8-18点。根据今年以来的销售数据,统计一天中销售的高峰时间段。bucket_sort:根据销售数量倒序。sale_sum:同样小时的销售数量。hours_sales:按小时统计。原创 2024-07-19 11:26:21 · 460 阅读 · 0 评论 -
Elasticsearch 使用terms对long类型日期统计按月销售
使用terms、script、子aggs实现long类型日期销售统计原创 2024-07-19 10:45:54 · 522 阅读 · 0 评论 -
Elasticsearch文档_id以数组方式返回
提取文档的_id字段,并且_id组装成一个数组。原创 2024-07-10 16:11:09 · 482 阅读 · 0 评论 -
Elasticsearch使用function_score查询酒店和排序
基于用户地理位置,对酒店做简单的排序,非个性化的推荐。酒店评分包含以下:酒店类型(依赖用户历史订单数据):希望匹配出更加符合用户使用的酒店类型酒店评分:评分高的酒店用户体验感好geo地理位置评分:例如出差的用户,距离较近的较为便捷价格评分(依赖用户历史订单数据):符合用户的消费习惯原创 2024-02-27 16:35:35 · 1538 阅读 · 0 评论 -
Elasticsearch terms使用脚本修改统计的数据源
索引中有两个 styleCode(类似spu)跟 goodsCode(类似sku)区分商品;现在需要根据品牌信息为七匹狼的数据使用goodsCode就行统计。原创 2024-02-26 17:57:01 · 683 阅读 · 0 评论 -
Elasticsearch 对索引中的两个字段是否相等进行筛选
如:索引中有两个 id跟 goodsCode;现在需要把id等于goodsCode的数据筛选出来;可以利用 script来实现。默认情况下在text类型字段中禁用 Fielddata,id字段是text类型。原创 2024-02-26 17:39:10 · 966 阅读 · 0 评论 -
Cannot apply [>] operation to types [ScriptDocValues.Doubles] and [java.lang.Integer]
原因是在脚本中balance对应的类型是ScriptDocValues.Doubles,也就是封装类型,能直接执行>、原创 2024-01-30 15:42:52 · 755 阅读 · 0 评论 -
ES系列索引、文档、集群、技术原理以及实战文章目录
elasticsearch基础、索引操作、文档增删改查、集群搭建、集群节点、集群负载均衡、文档评分、分析器等技术系列文章原创 2024-01-26 10:53:11 · 744 阅读 · 0 评论 -
ES的一些名称和概念总结
倒排索引的工作原理是这样的:当我们想要搜索包含特定关键词的文档时,Elasticsearch会首先在Term Dictionary中找到这个关键词,然后在Term Index中找到这个关键词在Term Dictionary中的位置。但是,设定索引的分片数量是一个需要仔细考虑的决策,因为一旦索引创建后,主分片的数量将无法更改,且过多的分片可能导致资源浪费及降低性能。在一些其他语言中,词干的概念也非常重要。例如,在俄语或者拉丁语中,通过改变词干的形式或者添加不同的词尾,可以表达出不同的语法关系和词性变化。原创 2024-01-26 10:00:35 · 1789 阅读 · 0 评论 -
ES-index索引配置
Index Options index索引配置项使用。index_options Index 有4中配置,可以控制倒排索引的内容。 Text类型默认记录positions,其他默认docs。记录的内容越多,所占用的空间越大。 Index 有4中配置如下:docs 记录doc id。freqs 记录doc id 和term frequencies。positions 记录doc id / term frequencies / term positions。offsets原创 2022-04-18 21:58:14 · 2834 阅读 · 0 评论 -
ES-DynamicMapping、文档字段类型
Dynamic Mapping什么是Dynamic Mapping 在写入文档时候,如果所有不存在,会自动创建索引。 Dynamic Mapping的机制,使得我们无需手动自定义Mappings。Elasticsearch会自动根据文档信息,推算出自动的类型。 但是有时候回推算不正确,例如地理位置信息,当类型如果不对时,会导致一些功能无法正常运行,例如Range查询。类型的自动识别JSON类型Elasticsearch类型字符串1.匹配日期格式,设置成Date 2.原创 2022-04-18 20:55:57 · 625 阅读 · 0 评论 -
ES-索引、文档插入、更新、删除、脚本API和Query参数
文档操作语法:{GET|POST|DELETE|PUT} {索引名称|索引名称表达式} {_doc|_create|_search} {文档ID} {?param=value} {body参数}原创 2022-03-26 23:21:06 · 4767 阅读 · 0 评论 -
ES文档索引、查询、分片、文档评分和分析器技术原理
分析(analysis)是在文档被发送并加入倒排索引之前,Elasticsearch在其主体上进行的操作。在文档被加入索引之前,Elasticsearch让每个被分析字段经过一系列的处理步骤。字符过滤:使用字符过滤器转变字符。文本切分为分词:将文本切分为单个或多个分词。分词过滤:使用分词过滤器转变每个分词。分词索引:将这些分词存储到索引中。使用到ElasticSearch的字符过滤器分词器分词过滤器和分词索引,它们便组成了分析器(analyzer)。字符过滤器。原创 2024-01-26 10:34:15 · 3019 阅读 · 0 评论 -
ES-aggregation聚合分析
集合的分类Bucket Aggregation 一些列满足特定条件的文档集。Metric Aggregation 一些数学运算,可以对文档字段进行统计分析。 Metric会基于数据集计算结果,除了支持在字段上进行计算,同样也支持在脚步(painless script)产生的结果之上进行计算。 大多数Metric是数学计算,仅输出一个值。 min / max / sum / avg / cardinality 部分Metric支持输出多个数值。 stats / percenti原创 2022-04-20 23:02:24 · 602 阅读 · 0 评论 -
ES-集群安装和启动图解
安装ES 1.下载ES 2.解压并且启动ES 把elasticsearch-7.1.1-windows-x86_64 压缩包解压到G:\opt\ES\elasticsearch-7.1.1 执行下面命令:G:\opt\ES\elasticsearch-7.1.1\bin>elasticsearch3.在浏览器中打开 http://127.0.0.1:9200/看到以下信息表示ES启动成功{ "name" : "node0", "cluster_name" : "pp原创 2022-03-22 22:31:36 · 2275 阅读 · 0 评论 -
ES集群节点、主从、负责均衡
Elasticsearch的协调节点并不是master节点。Master节点:负责集群范围内的管理和控制,例如创建或删除索引,决定哪些分片分配给哪个节点,以及跟踪哪些节点是加入或离开集群。Data节点:负责存储数据、执行数据相关的操作如增删改查、搜索和聚合。Ingest节点:负责预处理文档,在它们被索引之前执行各种转换。协调节点(Coordinating only node):当一个节点设置成既不是master节点、data节点也不是ingest节点时,它就是一个纯协调节点。原创 2024-01-26 10:30:47 · 3733 阅读 · 0 评论 -
ES-API约定
多索引expand_wildcards 设置是否扩展通配符到closed的index中,open表示只在匹配并为open的index中查询,closed表示在匹配的所有的index中查询, 默认为closed。 值为open,close,none,all。open:表示只支持open类型的索引close:表示只支持关闭状态的索引none:表示不可用all:表示同时支持open和close索引allow_no_indices 当使用通配符查询时,当有索引不存在的时候是否返回查询失败原创 2022-03-26 16:54:12 · 3215 阅读 · 0 评论 -
ES 可扩展、高可靠、使用场景等常见问题
ElasticSearch是一款非常强大的、基于Lucene的开源搜索及分析引擎;它是一个实时的分布式搜索分析引擎,它能让你以前所未有的速度和规模,去探索你的数据。它被用作全文检索、结构化搜索、分析Wikipedia 使用 Elasticsearch 提供带有高亮片段的全文搜索,还有 search-as-you-type 和 did-you-mean 的建议。卫报 使用 Elasticsearch 将网络社交数据结合到访客日志中,为它的编辑们提供公众对于新文章的实时反馈。原创 2024-01-26 09:57:58 · 1555 阅读 · 0 评论 -
ES性能优化和注意事项
当然,最好同时考虑原则 2。考虑一下 node 数量,一般一个节点有时候就是一台物理机,如果分片数过多,大大超过了节点数,很可能会导致一个节点上存在多个分片,一旦该节点故障,即使保持了 1 个以上的副本,同样有可能会导致数据丢失,集群无法恢复。此外,Elasticsearch 作为搜索引擎时,主要承载 query 的匹配和排序的功能,那数据的存储类型基于这两种功能的用途分为两类,一是需要匹配的字段,用来建立倒排索引对 query 匹配用,另一类字段是用做粗排用到的特征字段,如 ctr、点击数、评论数等等。原创 2024-01-26 10:32:56 · 1763 阅读 · 0 评论