亚马逊云科技上新!专为AI量身打造的统一嵌入模型

图片



亚马逊云科技推出Amazon Nova多模态嵌入模型,这是一款专为Agentic RAG与语义搜索应用打造的顶尖多模态嵌入模型,现已在Amazon Bedrock上线。它是首个通过单一模型支持文本、文档、图像、视频与音频的统一嵌入模型,能以行业顶尖的准确率实现跨模态检索。


嵌入模型可将文本、视觉、音频输入转换为数值表示形式的嵌入向量,这些嵌入向量会捕捉输入内容的语义信息,供AI系统进行比较、搜索与分析,为语义搜索、检索增强生成(RAG)等场景提供技术支撑。


当今,企业正不断寻求解决方案,以期从文本、图像、文档、视频、音频等海量非结构化数据中挖掘价值。例如,某企业可能拥有产品图片、包含信息图与文字的宣传册,以及用户上传的视频片段。尽管嵌入模型能够挖掘非结构化数据的价值,但传统模型通常仅擅长处理单一类型的内容。这一局限迫使客户要么构建复杂的跨模态嵌入解决方案,要么仅局限于单一内容类型的应用场景。这一问题同样存在于混合模态内容类型,例如文本与图像内容交织的文档,或融合视觉、音频、文本元素的视频,现有模型也难以有效捕捉这类内容中的跨模态关联。


Amazon Nova多模态嵌入模型正为解决上述挑战而生!它为文本、文档、图像、视频、音频构建了统一的语义空间,可支持多种场景,包括混合模态内容的跨模态搜索、基于参考图像的搜索,以及视觉文档检索。


图片




Amazon Nova多模态

嵌入模型的性能评估




开发团队基于各类基准测试对该模型性能进行了评估,结果显示,其开箱即用的准确率处于领先水平,具体数据如下表所示:


图片



Amazon Nova多模态嵌入模型支持的上下文长度最高达8000 tokens,可处理的文本语言多达200种,并能通过同步与异步API接收输入。此外,它支持分段处理功能(也称为 “分块”,Chunking),可将长文本、视频或音频内容拆分为易于处理的片段,并为每个片段生成嵌入向量。最后,该模型提供四种输出嵌入维度,采用套娃表征学习(Matryoshka Representation Learning,MRL)训练,能在几乎不影响准确率的前提下,实现低延迟的端到端检索。



须知事项




Amazon Nova多模态嵌入模型提供四种输出维度选项:3072、1024、384和256。输出维度越大,生成的表征信息则越详细,但也需要占用更多的存储空间和计算资源。相反,输出维度越小,则能在检索性能与资源效率之间实现更实用的平衡。这种灵活性可帮助用户根据具体应用场景和成本需求进行优化。


该模型能处理较长的上下文内容。对于文本输入,它单次可处理多达8192个tokens;对于视频和音频输入,支持处理长达30秒的片段,且能对更长的文件进行分段处理。在处理大型媒体文件时,这种分段能力尤为实用——模型会将文件拆分为易于处理的片段,并为每个片段生成嵌入向量。


该模型包含集成了内置于Amazon Bedrock的负责任的AI功能。提交用于生成嵌入向量的内容会经过Amazon Bedrock内容安全过滤器的检测,同时模型还内置公平性措施以减少偏差。


该模型可通过同步和异步API调用。同步API适用于需要即时响应的实时应用场景,例如在搜索界面中处理用户查询;异步API则能更高效地处理对延迟不敏感的工作负载,因此更适合处理视频等大型内容。


可用性与定价




Amazon Nova多模态嵌入模型现已在Amazon Bedrock上线,可用区域包括美国东部(弗吉尼亚北部)的亚马逊云科技区域。如需详细定价信息,请参阅Amazon Bedrock定价页面。


如需了解更多内容,可参阅《Amazon Nova用户指南》获取完整文档,或参阅GitHub上的Amazon Nova模型实践手册获取实用代码示例。


如果您在使用Amazon Q Developer、Kiro等AI驱动的软件开发助手,可搭建Amazon Web Services API MCP服务器,帮助这些AI助手与亚马逊云科技服务及资源交互;同时可搭建Amazon Knowledge MCP服务器,以获取最新文档、代码示例,以及关于Amazon Web Services API 区域可用性和Amazon CloudFormation资源的知识。


即刻体验Amazon Nova多模态嵌入模型,开启多模态AI应用构建之旅!


Amazon Bedrock定价页面:

https://aws.amazon.com/bedrock/pricing/

《Amazon Nova用户指南》

https://docs.aws.amazon.com/nova/latest/userguide/what-is-nova.html

Amazon Nova 模型实践手册:

https://github.com/aws-samples/amazon-nova-samples



点击文末【阅读原文】,获取产品更多详细信息!



本篇作者





图片

Danilo Poccia

Danilo Poccia作为亚马逊云科技的首席布道师(EMEA),他利用自己的经验帮助人们将想法变为现实,专注于Serverless架构、事件驱动编程以及机器学习和边缘计算的技术和商业影响。他是《Amazon Lambda in Action》一书的作者。



我们正处在Agentic AI爆发前夜。企业要从"成本优化"转向"创新驱动",通过完善的数据战略和AI云服务,把握全球化机遇。亚马逊将投入1000亿美元在AI算力、云基础设施等领域,通过领先的技术实力和帮助“中国企业出海“和”服务中国客户创新“的丰富经验,助力企业在AI时代突破。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值