
Elastic
文章平均质量分 91
Elastic 中国社区官方博客
Elastic 首席布道师,Elastic 认证工程师,认证分析师,认证可观测性工程师,阿里云最有价值专家
展开
-
现在支持通过 EDOT Collector 在 Kubernetes 上动态发现工作负载
了解 Elastic 的 OpenTelemetry Collector 如何利用 Kubernetes pod 注解提供动态工作负载发现,并改善 Kubernetes 集群的自动化指标和日志收集。在 Elastic,我们专注于 Kubernetes 作为最重要的可观察性用例之一。我们希望提供基于现实世界 GitOps 最佳实践的最佳入门体验和生命周期管理。最近,OpenTelemetry 发布了一篇博客,介绍了如何基于 Kubernetes Pods 的 annotations 进行自动发现,原创 2025-04-02 11:31:22 · 832 阅读 · 0 评论 -
检测数据中的关系:Spotify Wrapped,第 4 部分
图表是检测数据关系的强大工具。在这篇博客中,我们将探讨艺术家与你的音乐品味之间的关系。在音乐的背景下,关系可以是很多东西。它可以是艺术家之间的关系、流派之间的关系、歌曲之间的关系,甚至是一天中的时间与你所听音乐之间的关系。在这篇博客文章中,我们将专注于艺术家之间的关系。原创 2025-04-02 10:26:13 · 736 阅读 · 0 评论 -
RAG vs. Fine Tuning ,一种实用比较方法
比较 RAG 与 Fine-Tuning 工具,以电子商务聊天机器人为实际示例。选择 fine-tuning 还是 RAG 取决于每个系统的需求。一个常见的模式是使用一些特定领域的 fine-tuned 模型,如 FinGPT 用于金融、LEGAL-BERT 用于法律,或 medAlpaca 用于医疗,以获取常用术语。然后,框定答案的上下文,并在其基础上构建一个 RAG 系统,结合公司特定的文档。Fine-tuning 在你想管理模型行为时很有用,尤其是当通过 prompt engineering 无法原创 2025-04-01 10:45:33 · 627 阅读 · 0 评论 -
了解可观察性指标:类型、黄金信号和最佳实践
Elastic 可观察性通过基于搜索的相关性、防止停机、无妥协的数据保留、提高操作效率和降低成本,以及面向未来的投资,帮助加速问题解决。借助一个开放的、优先支持 OTel 的解决方案,你可以在最广泛的数据源中获得快速、上下文相关和统一的洞察,并与不断发展的技术生态系统无缝集成。核心指标使有效的可观察性成为可能,并最终实现数据驱动的决策,从而带来更好的业务成果。可观察性指标提供了对应用程序、系统和基础设施的性能、行为和健康状态的洞察 —— 使可观察性实践成为可能,这就是通过检查数据来了解系统内部状态的方式。原创 2025-03-31 19:24:49 · 718 阅读 · 0 评论 -
AI 驱动的安全分析的价值是什么?
与 Enterprise Strategy Group 一起量化经济影响安全行业十分复杂,变化速度极快。攻击面、利益相关者需求、对手战术以及你使用的工具都在不断演变,导致许多安全团队不确定自己是否已做好准备。在这场无休止的战斗中,你需要值得信赖的工具,同时还能带来可观的投资回报。这些工具应提供无与伦比的可见性、降低风险,并具备与数据需求匹配的可扩展性,而不会造成高昂成本。原创 2025-03-31 18:33:25 · 758 阅读 · 0 评论 -
将代理连接到 Elasticsearch 使用模型上下文协议
我们使用 Model Context Protocol 服务器 与 你的 数据 在 Elasticsearch 中聊天。如果与你的数据交互像与同事聊天一样轻松,会怎样?想象一下,你只需简单地问:“显示上个月所有超过 $500 的订单” 或 “哪些产品获得最多的 5 星评价?”就能立即获得准确答案,无需查询。模型上下文协议(Model Context Protocol - MCP)让这一切成为可能。它无缝连接对话式 AI 与你的数据库和外部 API,将复杂请求转换为自然对话。原创 2025-03-30 09:49:43 · 784 阅读 · 0 评论 -
如何自动化同义词并使用我们的 Synonyms API 进行上传
了解如何使用 LLM 来自动识别和生成同义词, 使术语可以通过程序方式加载到 Elasticsearch 同义词 API 中。提高搜索结果的质量对于提供高效的用户体验至关重要。优化搜索的一种方法是通过自动扩展查询词。这样可以更广泛地解释查询内容,覆盖语言变体,从而改进结果匹配。本博客探讨了如何利用自动识别和生成同义词,使这些术语可以通过程序方式加载到中。使用相较于是一种更快速且更具成本效益的解决方案。它的实现更简单,因为它不需要深入了解或复杂的向量摄取过程。此外,同义词的。原创 2025-03-28 09:05:53 · 2134 阅读 · 0 评论 -
使用集成过滤插件在 Logstash 中处理来自 Elastic 集成的数据
通过使用集成过滤插件,将数据处理操作从你的 Elastic 部署卸载到 Logstash。Logstash 的 Elastic 集成过滤插件允许你在 Logstash 内执行摄取管道来处理来自 Elastic 集成的数据,然后再将数据转发到 Elastic。原创 2025-03-27 20:51:52 · 871 阅读 · 0 评论 -
Elasticsearch:理解政府中的人工智能 - 应用、使用案例和实施
人工智能技术在私营部门无处不在。中的应用稳步改变着效率、生产力和盈利能力。然而,在速度比其他行业慢。从州到联邦政府机构,人工智能有可能通过增强决策、简化操作和改善市民服务来彻底改变公共行政。它为解决社会挑战,如食品不安全、环境问题和公共安全,提供了机会。然而,政府中的人工智能也带来了治理方面的考虑,这将影响最佳实践的形成,随着新技术的出现而不断发展。原创 2025-03-27 10:17:15 · 945 阅读 · 0 评论 -
Elasticsearch:使用 Azure AI 文档智能解析 PDF 文本和表格数据
了解如何使用 Azure AI 文档智能解析包含文本和表格数据的 PDF 文档。Azure AI 文档智能是一个强大的工具,用于从 PDF 中提取结构化数据。它可以有效地提取文本和表格数据。提取的数据可以索引到 Elastic Cloud Serverless,以支持 RAG(- 检索增强生成)。在这篇博客中,我们将通过摄取四份最新的 Elastic N.V. 季度报告来演示 Azure AI 文档智能的强大功能。原创 2025-03-27 09:18:45 · 803 阅读 · 0 评论 -
Elasticsearch:人工智能时代的公共部门数据治理
人工智能(AI)和生成式人工智能(GenAI)正在迅速改变公共部门,从理论探讨走向实际应用。正确的数据准备、管理和治理将在 GenAI 的成功实施中发挥关键作用。我们最近举办了一场名为 “” 的网络研讨会,邀请了行业专家 IDC 研究总监 Max Klaps 和 Elastic 杰出架构师 Dave Erickson。他们探讨了 GenAI 在政府、教育和国防领域的现状,并深入分析了 GenAI 带来的数据挑战和机遇。公共部门机构对 AI 的态度发生了重大转变。原创 2025-03-27 08:30:07 · 833 阅读 · 0 评论 -
Elasticsearch:使用 AI SDK 和 Elastic 构建 AI 代理
AI 代理是一种能够自主执行任务并代表人类采取行动的软件,它利用人工智能实现这一目标。AI 代理通过结合一个或多个大语言模型(large language models - LLMs)与用户定义的工具(或函数)来执行特定操作。例如,这些工具可以执行以下操作:从数据库、传感器、API 或 Elasticsearch 等搜索引擎提取信息。执行复杂计算,并让 LLM 总结其结果。基于各种数据输入快速做出关键决策。根据响应触发必要的警报和反馈。如果你之前对 AI 代理还不完全了解,现在你应该清楚了!原创 2025-03-26 10:25:01 · 1171 阅读 · 0 评论 -
谁是 AI 搜索先锋? Elastic 先锋者招募令正式启动!
在人工智能(正文简称“AI”)技术深刻重构全球产业生态的当下,AI 搜索技术正以革新性力量驱动千行万业智能化跃迁。值此技术变革关键节点,业界领先的搜索分析引擎 Elasticsearch 也迎来了自己 15 年的里程碑,Elastic 公司宣布于 3 月 26 日在中国市场正式启动“Elastic Pioneer” 先锋者计划。这一计划,是 Elastic 中国精心筹备的 Elastic 推广大使招募项目,旨在汇聚社区开发者的力量,共同构建 AI 搜索技术应用新范式,加速企业数字化转型进程。原创 2025-03-26 09:11:30 · 1254 阅读 · 0 评论 -
异常检测群体任务:Spotify Wrapped,第三部分
异常检测一开始可能会让人望而生畏,但在这篇博客中,我们将深入探讨它,并了解不同的任务如何帮助我们发现 Spotify Wrapped 数据中的异常模式。在,我们讨论了如何获取你的 Spotify Wrapped 数据并对其进行可视化。在,我们讲解了如何处理数据以及如何可视化展示。在第三部分,我们将探讨如何在你的 Spotify Wrapped 数据中检测异常。异常检测作业是 Elastic 中用于查找数据中异常模式的工具。原创 2025-03-25 08:20:38 · 1046 阅读 · 0 评论 -
Elasticsearch:设置向量搜索
当你开始使用 Elastic 时,你将使用 Elasticsearch Relevance Engine™,它专为 AI 搜索应用程序提供支持。通过 ESRE,你可以利用一整套开发者工具,包括 Elastic 的文本搜索、向量数据库以及我们专有的 Transformer 模型进行语义搜索。Elastic 提供多种搜索技术,从 BM25 开始,这是文本搜索的行业标准。它可以精准匹配特定搜索内容,匹配精确的关键词,并且可以通过调优来提升效果。在开始使用。原创 2025-03-24 21:23:27 · 989 阅读 · 0 评论 -
Elasticsearch:构建 AI 驱动的搜索体验
当你开始使用 Elastic 时,你将使用 Elasticsearch Relevance Engine™,它专为 AI 搜索应用程序提供支持。借助 ESRE,你可以利用一整套开发者工具,包括 Elastic 的文本搜索、向量数据库以及我们专有的用于语义搜索的 Transformer 模型。Elastic 提供多种搜索技术,首先是 BM25,它是行业标准的文本搜索方法。BM25 可精准匹配特定搜索,找到精确的关键词,并且可以通过调优提升效果。在开始。原创 2025-03-24 14:38:38 · 1060 阅读 · 0 评论 -
Elastic 线下 Meetup 将于 2025 年 4 月 19 号下午在杭州举行
2025 Elastic Meetup 杭州站活动,由 Elastic、阿里云、新智锦绣联合举办,现诚邀广大技术爱好者及开发者参加。2025 年 4 月 19 日 13:30-18:00浙江省杭州市余杭区文一西路969号阿里巴巴西溪A区-A区访客中心-2F-208S 曼陀山庄2025 Elastic Meetup 杭州站 预约报名-Elastic 中国官方活动号活动-活动行请报名成功后,扫码加入本次活动群,接收活动相关信息讲师:Elastic 社区首席布道师 —— 刘晓国现为 Elastic 社区首席布原创 2025-03-23 18:17:32 · 786 阅读 · 0 评论 -
Elastic 和 Tines 合作提供 SOAR 和 AIOps
使用 Tines Workflow Automation 自动化你的安全和可观测性工作流,现在可直接在 Elastic 中使用。Elastic 和 Tines 正式推出一款集成产品,旨在改变安全和可观测性团队的核心工作。我们很高兴推出 Tines Workflow Automation,现在可直接通过 Elastic 使用。原创 2025-03-23 10:47:46 · 912 阅读 · 0 评论 -
Elasticsearch:可配置的推理 API 端点分块设置
Elasticsearch 开放推理 API 现已支持可配置的分块,以便在文档摄取时处理语义文本字段。Elasticsearch 推理 API 允许用户利用各种提供商的机器学习模型执行推理操作。其中一个常见用例是在索引中支持用于语义搜索的语义文本字段。随着文档数据量的增加,对整个数据创建嵌入可能会导致结果不够准确。此外,一些推理模型对可处理的输入大小有限制。原创 2025-03-22 08:33:52 · 819 阅读 · 0 评论 -
在 Elasticsearch 中扩展后期交互模型 - 第 2 部分 - 8.18
本文探讨了如何优化后期交互向量,以适应大规模生产工作负载,例如减少磁盘空间占用和提高计算效率。在中,我们探讨了如何使用创建视觉搜索应用。我们主要关注ColPali等模型为应用带来的价值,但与E5等双编码器向量搜索相比,它们在性能上存在一定劣势。基于的示例,本文将探讨如何利用不同技术和强大的向量搜索工具,使后期交互向量适应大规模生产工作负载。完整代码示例可在上查看。ColPali在索引中的每个文档页面会生成N接下来,我们将探讨一些优化技术,以解决这些问题。原创 2025-03-21 09:52:15 · 937 阅读 · 0 评论 -
在 Elasticsearch 中探索基于 NVIDIA 的 GPU 加速向量搜索
由 NVIDIA cuVS 提供支持,此次合作旨在为开发者在 Elasticsearch 中的向量搜索提供 GPU 加速。在 Elastic Engineering 组织内,我们一直致力于优化向量数据库的性能。我们的使命是让 Lucene 和 Elasticsearch 成为最优秀的向量数据库。通过硬件加速的、引入新的向量数据压缩创新(),以及进一步优化 BBQ 的算法以带来更大收益,同时。原创 2025-03-20 08:52:47 · 1815 阅读 · 0 评论 -
Elasticsearch 在航空行业:数据管理的游戏规则改变者
数字化客户体验不再是奢侈品,而是。它推动了客户满意度,提升了运营效率,并创造了可持续的竞争优势。随着行业的不断发展,优先投资前沿数字技术和平台的航空公司将在动态和要求苛刻的市场中更具竞争力。实时存储、搜索和分析大量数据的能力在航空公司运营、客户服务、安全和合规方面起着至关重要的作用。数据管理的强大应用和执行帮助航空公司、机场和服务提供商提升运营效率、改善客户体验,并获得竞争优势。差的应用可能导致滞留地面,失去竞争优势。原创 2025-03-19 09:43:53 · 888 阅读 · 0 评论 -
Elasticsearch:使用 ColPali 进行复杂文档搜索 - 第 1 部分 - 8.18
这篇文章介绍了 ColPali 模型,这是一种 late-interaction 模型,可简化包含图片和表格的复杂文档搜索过程,并讨论了其在 Elasticsearch 中的实现。在构建搜索应用时,我们经常需要处理具有复杂结构的文档 —— 例如表格、图片、多列等。传统上,这需要设置复杂的检索流程,包括 OCR(光学字符识别)、布局检测、语义分块 等多个处理步骤。2024 年,引入了 ColPali 模型,以解决这些挑战并简化整个流程。原创 2025-03-19 08:56:09 · 1121 阅读 · 0 评论 -
如何使用 DeepEval 优化 Elasticsearch 中的 RAG 检索
学习如何使用 DeepEval 优化 RAG 流水线中的 Elasticsearch 检索器。LLMs 容易产生幻觉、缺乏特定领域的专业知识,并受限于上下文窗口。检索增强生成(Retrieval-Augmented Generation - RAG)通过使 LLM 访问相关的外部上下文来解决这些问题,从而使其回答更加准确。多种 RAG 方法(如 GraphRAG 和 AdaptiveRAG)已经出现,以提高检索的准确性。原创 2025-03-18 08:49:15 · 771 阅读 · 0 评论 -
Elasticsearch:为推理端点配置分块设置
推理端点对一次可处理的文本量有限,具体取决于模型的输入容量。是指将输入文本拆分成符合这些限制的小块的过程,在将文档摄取到字段时会进行分块。分块不仅有助于保持输入文本在可处理范围内,还能使内容更加易读。相比返回一整篇长文档,在搜索结果中提供最相关的文本片段更有价值。每个分块都会包含以及。默认情况下,文档会被拆分为,然后按进行分组,并且设置,使得每个分块都会与前一个分块共享一个句子。这种重叠方式可以保持上下文的连续性,防止重要信息因硬性拆分而丢失。使用库来检测单词和。原创 2025-03-17 13:20:58 · 1035 阅读 · 0 评论 -
介绍 OpenTelemetry 的 OTTL Playground
Elastic 自豪地推出 OTTL Playground(),这是一款功能强大且用户友好的工具,旨在让用户轻松体验 OpenTelemetry Transformation Language (OTTL)。该 Playground 提供丰富的界面,用户可以实时创建、修改和测试语句,从而更轻松地理解不同配置对 OpenTelemetry 数据转换的影响。原创 2025-03-16 09:00:37 · 857 阅读 · 0 评论 -
如何通过 Airbyte 将数据摄取到 Elasticsearch
Airbyte 是一个数据集成工具,可自动化并可扩展地将信息从各种来源传输到不同的目的地。它使你能够从 API、数据库和其他系统提取数据,并将其加载到 Elasticsearch 等平台,以实现高级搜索和高效分析。本文将介绍如何配置 Airbyte 将数据摄取到 Elasticsearch,涵盖关键概念、先决条件和分步集成过程。原创 2025-03-15 10:27:27 · 894 阅读 · 0 评论 -
LLM 可观测性:使用 Elastic 的 OpenAI 集成追踪使用情况并管理成本
Elastic 全新的 OpenAI 可观测性集成提供对 OpenAI 模型使用情况的全面洞察。借助我们预构建的仪表板和指标,你可以高效追踪和监控 OpenAI 模型的使用情况,包括 GPT-4o 和 DALL·E。在 AI 驱动的应用日益普及的时代,理解和管理语言模型的使用至关重要。OpenAI 率先开发了先进的语言模型,支持从聊天机器人到代码生成等众多应用。然而,随着应用复杂度和规模的增长,监控关键指标以确保最原创 2025-03-14 10:09:26 · 886 阅读 · 0 评论 -
Elasticsearch:语义文本 - 更简单、更好、更精炼、更强大 8.18
我们最新的 semantic_text 迭代带来了大量改进。除了简化 _source 中的表示之外,其好处还包括减少冗长程度、更高效的磁盘利用率以及更好地与其他 Elasticsearch 功能集成。你现在可以使用突出显示来检索与你的查询最相关的块。也许最重要的是,它现在是一个正式发的功能!我们在字段类型上经历了一段漫长的旅程,而这一最新版本承诺让语义搜索变得前所未有的简单。除了在_source中简化。原创 2025-03-14 09:16:17 · 1065 阅读 · 0 评论 -
统一 Elastic 向量数据库与 LLM 功能,实现智能查询
利用 LLM 功能进行查询解析,并使用 Elasticsearch 搜索模板,将复杂的用户请求转换为结构化的、基于模式的搜索,从而实现高精度查询结果。想象一下,你在搜索“距离 Belongil Beach 250 米内、最近翻新、至少 4 星级、配有游泳池和健身房的住宿”,而搜索引擎精准地返回了符合你需求的结果。智能搜索能够理解查询意图并进行推理,仅靠启发式方法难以实现这种能力。原创 2025-03-13 14:30:48 · 1161 阅读 · 0 评论 -
拆解 “ES 已死“ 伪命题:Agentic RAG 时代搜索引擎的终极形态
综上所述,无论是传统 RAG 场景,还是代表未来趋势的 Agentic RAG 场景,Elasticsearch 凭借其丰富的功能、强大的处理能力以及完整的闭环体系,都将是技术选型时不容忽视的择优选项。那些宣扬 “ES已死” 的言论,纯粹就是瞎扯。其实开源社区真没必要天天想着怎么攻击别人,也别总想着用一些歪门邪道去误导用户。真想让这个行业进步,应该是一起把蛋糕做大,让更多的使用场景从传统的文本检索上进行迁移。原创 2025-03-13 09:21:27 · 1143 阅读 · 0 评论 -
使用 Elasticsearch 构建多模式 RAG 系统:哥谭市的故事
学习如何构建一个多模态检索增强生成 (RAG) 系统,该系统集成文本、音频、视频和图像数据,以提供更丰富的、具有上下文的信息检索。在这篇博客中,你将学习如何使用 Elasticsearch 构建一个多模态 RAG(Retrieval-Augmented Generation - 检索增强生成)流水线。我们将探讨如何利用 ImageBind 生成各种数据类型(文本、图像、音频、深度图等)的嵌入向量,并了解如何使用 dense_vector 和 k-NN 搜索 高效存储和检索这些嵌入向量。最后,我们将集原创 2025-03-12 11:22:48 · 1512 阅读 · 0 评论 -
超越向量:带 Agents 的智能混合搜索
仅靠向量搜索无法考虑时间、空间或意图,限制了其有效性。值得庆幸的是,解决方案在于将 Elastic 的传统搜索功能与智能体驱动的 LLMs 结合使用。今天,我们将论证采用智能体驱动的 LLM 方法来提升搜索相关性并解决复杂的用例问题,并以“了解你的客户”(Know-Your-Customer - KYC)用例来展示这些优势。这是之前在 Searchlabs 发布的 Agentic RAG 文章的后续内容。前文介绍了代理在 RAG 用例中的实现,并提供了必要的背景知识。在此基础上,我们进一步扩展了原创 2025-03-11 10:02:22 · 830 阅读 · 0 评论 -
Agentic RAG 详解 - 从头开始构建你自己的智能体系统
虽然检索增强生成(RAG)在 2023 年占据主导地位,但代理工作流正在推动 2024 年的巨大进展。智能体的使用为构建更强大、稳健且多功能的 大型语言模型(LLM)应用程序开辟了新的可能性。其中一种可能性是在 RAG 流水线中引入智能体,形成代理式 RAG 流水线。本文将介绍 Agentic RAG 的概念、其实现方式,以及其优势和局限性。原创 2025-03-11 08:02:56 · 1672 阅读 · 0 评论 -
Elastic Security 荣获 AV-Comparatives 2024 企业认可产品奖
因其卓越的防护性能、卓越的性能表现以及极低的误报率而获奖。Elastic Security 荣获。这一荣誉体现了其出色的恶意软件防御、最佳的系统性能和最小的误报率。在保护、性能和误报基准测试中表现卓越,Elastic Security 证明了其无妥协地保护组织的能力。这一独立认可强调了我们致力于为企业提供世界级安全解决方案的承诺。原创 2025-03-10 10:14:02 · 640 阅读 · 0 评论 -
电信行业的 AI:克服基础数据挑战
电信行业一直站在创新与互联的前沿,常常为客户的数字体验设定高标准和期望。如今,随着 AI 逐渐超越流行词的阶段,电信行业的领导者们正稳步将 AI 融入业务,以进一步提升响应客户需求的能力,并提供高质量的服务。在这些数字体验,尤其是 AI 的核心,是能够战略性地利用数据来实现业务目标。原创 2025-03-10 10:04:01 · 789 阅读 · 0 评论 -
Elastic:AI 会开始取代网络安全工作吗?
AI 会开始取代网络安全工作吗?不会,但它正在从根本上改变这些工作。正迅速成为日常安全工作流程中的一个重要组成部分。那么,它是合作伙伴还是竞争对手?GenAI 技术在安全堆栈几乎每个方面的广泛应用,整体上帮助安全团队更高效地应对威胁。GenAI 使安全从业者能够访问并分析他们原本无法获得的数据,从而使他们的工作比以往任何时候都更具影响力。然而,与此同时,GenAI 也扩展了攻击面 —— 无论是通过对手能够大规模生产恶意代码,,还是日益复杂的社交工程攻击。那么,这一切如何影响今天的安全专业人士呢?原创 2025-03-09 10:07:52 · 1215 阅读 · 0 评论 -
使用 Elastic-Agent 或 Beats 将 Journald 中的 syslog 和 auth 日志导入 Elastic Stack
我们在 Elastic 一直努力将更多 Linux 发行版添加到我们的支持矩阵中,现在 Elastic-Agent 和 Beats 已正式支持 Debian 12!本文演示了我们正在开发的功能,以支持使用 Journald 存储系统和身份验证日志(auth logs)的 Linux 发行版。一些 Linux 发行版(如 Debian 12)已经完全放弃了传统的系统日志文件,因此现在获取这些日志的唯一方法是读取 Journald。原创 2025-03-09 09:50:38 · 1012 阅读 · 0 评论 -
Elasticsearch:使用 BigQuery 提取数据
了解如何使用 Python 在 Elasticsearch 中索引和搜索 Google BigQuery 数据。是 Google 的一个平台,允许你将来自不同来源和服务的数据集中到一个存储库中。它还支持数据分析,并可使用生成式 AI (GenAI) 和机器学习 (ML) 工具。以下是将数据引入 BigQuery 的方式:将所有这些来源的数据索引到 Elasticsearch,可帮助你集中数据源,从而获得更好的可观测性体验。原创 2025-03-08 08:19:19 · 1257 阅读 · 0 评论 -
语义搜索升级:现已支持原生 match、KNN 和 sparse_vector 8.18
语义文本搜索变得更加强大,现已原生支持 match、knn 和 sparse_vector 查询。这让我们能够保留语义查询的简洁性,同时提供 Elasticsearch 查询 DSL 的灵活性。Elasticsearch 的功能非常强大,允许用户对配置为字段的数据执行语义搜索。这种强大的核心在于其简洁性:你只需设置一个带有推理端点的字段,然后像向普通 text 字段一样写入内容即可。推理过程会自动且透明地进行,使得构建带有语义功能的搜索索引变得非常简单。原创 2025-03-07 09:54:12 · 957 阅读 · 0 评论