使用Elasticsearch和Bedrock构建RAG应用

最新推荐文章于 2025-09-05 16:26:30 发布

原创最新推荐文章于 2025-09-05 16:26:30 发布 · 1k 阅读

20 ·

CC 4.0 BY-SA版权

文章标签：

#AWS

使用Elasticsearch和Bedrock构建RAG应用

关键字: [Amazon Web Services re:Invent 2024，亚马逊云科技，生成式AI， Elastic Search， Vector Search Capabilities， Semantic Text Field， Retrieval Augmented Generation， Geospatial Search Features， Hybrid Search Approach]

导读

了解如何利用Elastic将Amazon Bedrock与其Elasticsearch开放推理API和Playground集成，以增强开发者使用Amazon Bedrock上任何大型语言模型构建Ray应用程序的灵活性。在本次会议中，回顾如何通过利用庞大的模型库来简化高级搜索体验的开发。探索开发者如何通过在Elasticsearch环境中直接进行高级模型测试和嵌入功能来改进对话式搜索。本次演示由亚马逊云科技合作伙伴Elastic为您带来。

演讲精华

以下是小编为您整理的本次演讲的精华。

深入探讨RAG方法的复杂性，演讲者阐明了支撑其效力的架构细微差别。在一种情况下，Amazon Lambda这种无服务器计算服务在丰富数据管道中发挥着关键作用。它的能力包括过滤掉无关数据、连接到Bedrock文本模型以生成日志数据或传输中消息的嵌入、随后将这些丰富的数据与传统数据格式一起存储在Elasticsearch的向量数据库中。

在搜索阶段，利用Elasticsearch在文档检索方面的实力，发挥其识别最相关数据源的能力，这些数据源可能包含了给定查询或问题的答案。这一过程通过连接到Bedrock来生成查询的嵌入，然后将其与存储在Elasticsearch中的嵌入进行比较来实现。同时，Amazon Lambda可以建立与Bedrock的连接，实现这些服务的无缝集成。

Elasticsearch作为一个拥有十年悠久历史的搜索引擎地位得到强调，演讲者强调它在为互联网上无数应用程序的搜索框提供支持方面的主导地位。这种文档检索的专业知识，加上Bedrock等模型的生成能力，构成了RAG方法的核心，能够生成与上下文相关的答案。

虽然向量数据库无疑至关重要，但演讲者断言它们只是一个起点。大型语言模型需要有意的反馈和关注，这凸显了构建全面的搜索应用程序的重要性，这些应用程序不仅仅是简单的检索。这种整体方法包括文档级安全性、字段级访问控制、跨数据中心的可扩展性、复制、混合搜索和聚合功能等特性，这证明了Elasticsearch的企业级强大实力。

量化创新步伐，演讲者透露，演示过程中展示的许多功能都是在过去六个月内实现的，这证明了Elasticsearch功能的快速发展。这包括语义重新排序、学习排序以及语义文本字段类型的引入等进步。

深入探讨技术规范，演讲者强调Elasticsearch支持高达4，096的向量维度，可以无缝容纳亚马逊Titan文本嵌入模型生成的1，536维嵌入。这种兼容性使得这些嵌入在Elasticsearch中的无缝存储和检索成为可能，这得益于原生亚马逊云科技和Elasticsearch API、流行框架如LangChain和LlamaIndex，或演示中展示的开放推理API。

针对密集向量存储带来的内存占用问题，演讲者介绍了量化技术，可以大幅减少内存需求。“BBQ”技术(一个来自演讲者对烧烤的喜爱的有趣绰号)通过将全浮点向量量化为位向量，实现了令人瞩目的95%内存需求减少。虽然这种压缩会带来一些保真度损失，但通过过采样和重新评分技术，可以保持与全尺寸向量相当的检索准确性。

此外，Elasticsearch还提供了其他量化选项，如int8和4位，默认情况下会将浮点向量量化为int8，从而实现75%的内存需求减少。值得注意的是，这种微小的召回率降低可以通过在检索过程中略微增加考虑的候选向量数量来克服，这是一种保持相关性的权衡。

演讲者还介绍了Elastic的学习稀疏编码器模型ULSER，这是一种由Elastic训练和托管的稀疏嵌入模型。只需单击或API调用，ULSER就可以自动下载并部署到Elasticsearch集群中，简化了集成过程。

在可观察性方面，演讲者强调了监控和排查这些应用程序的重要性，尽管它们具有先进的功能，但最终还是运行在基础设施之上并产生成本。他们展示了一个专门为亚马逊Bedrock量身定制的仪表板，用于可视化和管理部署需求。此外，Elastic的可观察性UI还集成了一个AI助手，利用RAG方法提供有关运营问题的见解，自动搜索相关的可观察性数据，如日志、指标、APM跟踪和云态势安全信息，并通过LLM集成生成答案。

量化他们解决方案的影响，演讲者引用了德国电子商务公司HSE的案例。通过采用Elastic和亚马逊云科技的现代搜索应用程序，HSE的点击率提高了4%，客户满意度提高了8%，员工用于软件维护的时间减少了惊人的42%。

另一个被强调的客户成功案例是Proficio公司，他们将Elastic安全解决方案与亚马逊Bedrock相结合。根据他们的证词，这种集成提高了34%的生产力，并预计在三年内将节省100万美元。

总之，这个叙述深入探讨了RAG方法的架构细节，阐明了亚马逊云科技服务、Elasticsearch的向量数据库能力和亚马逊Bedrock的生成模型之间的协同作用。量化技术带来的内存占用减少、向量维度兼容性和性能优化等量化见解，凸显了这一解决方案的技术实力。客户成功案例证实了其真实世界的影响，在关键指标如点击率、客户满意度和运营效率方面取得了可衡量的改进。

下面是一些演讲现场的精彩瞬间：

Ian Ray是亚马逊云科技的一位高级生成式AI合作伙伴解决方案架构师，在2024年的reInvent演讲中介绍了他的同事们。

他介绍了语义文本，这是一种新的字段类型，可以简化创建语义应用程序和为数据生成嵌入的过程，无需复杂的设置和配置。

亚马逊强调了混合搜索的重要性，将向量搜索和传统的词汇搜索相结合，以在各种用例中获得最佳性能。

Jeff Bezos推出了亚马逊泰坦文本嵌入模型，这是检索增强生成(RAG)架构的关键组件，能够高效存储和比较向量嵌入，从而提高相关性和上下文响应。

演讲者演示了如何轻松部署和免费试用弹性推理API和基岩模型，展示了消费亚马逊AI服务的简单性。

演示展示了一个强大的搜索引擎，结合了地理空间过滤、关键词搜索和语义搜索，可以根据位置、设施和特征等特定条件找到匹配的房产。

演讲者强调了ElasticSearch的强大地理空间检索功能，使应用程序能够无缝地从邻近区域获取房产信息。

总结

在这场精彩的演讲中，演讲者深入探讨了利用Elasticsearch和Amazon Bedrock构建检索增强生成(RAG)应用程序的复杂性。他们强调了结合向量搜索、语义搜索和传统关键词搜索的力量，以提供精确和上下文响应。

首先强调的关键点是从仅提供链接过渡到直接回答查询，利用RAG的能力。他们展示了Stack Overflow如何整合Elasticsearch和Bedrock，使用户能够提出自然语言问题并接收生成的答复。

其次，他们强调将专有数据与大型语言模型(LLM)相结合的重要性，以发挥LLM的真正潜力。RAG允许公司纳入其独特的最新信息，提高LLM响应的相关性和准确性。

第三个关键方面是Elasticsearch和Amazon Bedrock的无缝集成。Elasticsearch强大的向量数据库能力与Bedrock强大的生成模型相结合，为构建前沿RAG应用程序创造了强大的协同效应。语义文本字段、量化技术和混合搜索等功能进一步简化了开发过程。

总之，演讲者强调构建综合搜索应用程序的重要性，将各种检索技术(包括向量搜索、关键词搜索和地理空间搜索)相结合。他们展示了Elasticsearch和Amazon Bedrock如何使开发人员能够创建智能、上下文感知的RAG应用程序，提供精确和相关的答复，同时确保数据隐私和安全。

亚马逊云科技（Amazon Web Services）是全球云计算的开创者和引领者。提供200多类广泛而深入的云服务，服务全球245个国家和地区的数百万客户。做为全球生成式AI前行者，亚马逊云科技正在携手广泛的客户和合作伙伴，缔造可见的商业价值 – 汇集全球40余款大模型，亚马逊云科技为10万家全球企业提供AI及机器学习服务，守护3/4中国企业出海。