利用亚马逊云科技数据库助力应用程序面向未来

利用亚马逊云科技数据库助力应用程序面向未来

关键字: [Amazon Web Services re:Invent 2024, 亚马逊云科技, Amazon Aurora, Cloud Infrastructure, Data Management, Business Objectives, Automatic Scaling, Performance Optimization]

导读

在快速发展的 IT 环境中,规划数据库的长期变化具有挑战性。最佳方法是使用专为变化、灵活性和适应性而设计的数据库。在本讲座中,亚马逊云科技数据库和迁移副总裁 Jeff Carter 和关系数据库副总裁 Rahul Pathak 将介绍保护数据免受任何类型干扰的策略,使贵组织能够轻松采用生成式 AI 等新技术,并通过Zero-ETL 集成使用近乎实时的分析。亚马逊云科技数据库提供了一种易于更改的方法,可帮助充分释放创新潜能。

演讲精华

以下是小编为您整理的本次演讲的精华。

Rahul Pathak承认亚马逊云科技于2009年推出RDS开启了其数据库之旅,自2011年加入公司以来,他很幸运参与了许多这些计划。他对成为这一旅程的一部分感到兴奋,这一旅程以惊人的速度取得了进展,这得益于像您这样的客户的反馈和投入。云基础设施标志着技术构建方式的巨大变革,实现了无缝容量扩展和按使用付费模式。这些创新带来了托管关系型数据库和DynamoDB,后者在任何规模下都能提供单位毫秒级的响应时间。

Pathak强调,数据应该是亚马逊云科技在数据库和数据管理方面投资的核心,提供一种抽象的方式来管理数据,而不必关注底层系统。通过Redshift Serverless自动扩展,客户可以在性能和成本之间设置优先级,系统将代表他们做出扩展决策以满足这些目标。亚马逊云科技的规模为其代表客户进行创新提供了真正的机会,确保他们在声明目标后无需做任何工作。

讨论最新发布时,Pathak强调Graviton 3提供了更快的性能、更低的成本和更低的能耗,这在通常需要权衡的技术领域是一种罕见的组合。对于Amazon Aurora,亚马逊云科技推出了IOOptimized,这是一个针对IO密集型SQL Server工作负载的经济高效平台。RDS Custom for SQL Server允许客户使用自己的媒体安装文件,同时受益于RDS管理。亚马逊云科技已在Amazon Aurora Postgres和RDS Postgres中启用了PG Vector支持,使客户能够为生成式AI工作负载未来确保其Postgres投资。此外,RDS Multi-AZ with 2 Standbys在使用RDS Proxy时,可在不到一秒钟内完成次要版本升级。

在非关系型方面,DynamoDB现在提供了增量导出到S3的功能,而DocumentDB为IO密集型工作负载提供了IO优化功能。DocumentDB还允许与SageMaker和LLM集成,以在存储的文档上运行机器学习和生成技术。对于ElastiCache,亚马逊云科技现在可以通过Redis 7.1在每个节点上提供100万个请求/秒,在单个集群中可达到5亿个请求/秒,同时保持与开源Redis 100%兼容。

Jeff Carter介绍了来自IBM的Minaz Marali,他分享了DB2的见解,这是一款拥有30多年创新历史的关系型数据库,为包括10大银行、10大制造商中的9家以及财富100强公司中的76家在内的主要组织运行关键任务工作负载。Marali强调,如果您当天早上使用了信用卡,很有可能该交易是通过DB2数据库运行的,凸显了它作为”现代经济不可见的坚实后盾”的角色。

将DB2集成到Amazon RDS将为客户提供熟悉的RDS体验,包括供应、扩展、备份、高可用性以及与亚马逊云科技生态系统的无缝集成。DB2与Oracle数据库高度兼容,因此是将各种工作负载合并到单一数据库引擎的合适解决方案。许多IBM软件解决方案,包括Cognos Analytics、Sterling Order Management和OpenPages,已宣布支持RDS DB2,所有新开发的面向亚马逊云科技的IBM应用程序都将由DB2 RDS提供支持。

Carter宣布,与亚马逊云科技上的图形数据库同义的Amazon Neptune将被提升为品牌名称,其下将有多个产品。现有的Neptune产品将被重命名为Amazon Neptune Database,专注于图形空间中的事务性工作负载,而新推出的Amazon Neptune Analytics将专注于利用内存性能进行高速分析,使客户能够比领先产品快80倍分析数十亿个连接。

在讨论Amazon Aurora’s Limitless Database功能时,Carter解释说,它允许跨多个Aurora Serverless v2实例进行扩展,根据选定的键将数据分布在一系列Aurora实例上。这种方法可以根据工作负载需求自动扩展计算、内存和I/O吞吐量,同时支持分布式事务和查询,并为应用程序呈现无缝的单一数据库体验。

ElastiCache Serverless消除了提前供应决策的需要,可根据工作负载和数据自动扩展和缩减。通过Redis 7.1,亚马逊云科技可以在每个实例上提供高达100万笔交易/秒,在单个集群中可达5亿笔交易/秒,并提供4个9的可用性,覆盖了绝大多数市场。该系统还可以执行自动透明的软件修补,简化了缓存管理。

Carter讨论了集成数据的重要性,以及亚马逊云科技的零ETL集成,包括Aurora MySQL到Redshift、Aurora PostgreSQL到Redshift、RDS for MySQL到Redshift和DynamoDB到Redshift,实现了近乎实时的分析,无需复杂的管道。他强调,多个引擎可以为单个Redshift实例提供数据,实现诸如将来自多个履行中心的库存数据合并到一个Redshift实例中以获得实时可见性等场景。

此外,DynamoDB现在与Amazon OpenSearch实现了零ETL集成,允许对DynamoDB数据进行文本、向量、全文、神经、地理空间和混合搜索。

来自Heroku的Gail Fredericks分享了与亚马逊云科技合作将整个Heroku Postgres车队迁移到Amazon Aurora的见解。此次迁移将为Heroku客户带来更好的数据库弹性、自动磁盘扩展、容错、复制以及扩展到128TB(约1.1倍1TB)的能力,同时保持Heroku的简单性。Fredericks强调,Aurora将计算和存储分离提供了成本灵活性,可扩展到128TB,在类似硬件上比上游Postgres提供3倍的吞吐量,数据库升级只需几秒钟。

Heroku已设定在明年内将整个车队迁移到Amazon Aurora平台的宏伟目标,使Heroku能够快速推出Postgres创新。如今,在Aurora上,Heroku提供了更高的数据吞吐量、更多的数据库连接、更多种类的Postgres扩展以及多AZ复制。

Carter深入探讨了如何利用生成式AI增强亚马逊云科技服务,强调了基础模型、企业数据定制、向量数据库和自动化代理的重要性。他强调,企业数据是真正的差异化因素,如果每个人都可以访问相同的LLM,公司独特的数据将是构建差异化应用程序的关键。

在演示中,Carter展示了如何使用Amazon Bedrock通过Amazon Aurora创建知识库,从S3存储桶中摄取文档、生成向量嵌入并将其同步到Aurora集群。演示突出了选择Aurora作为向量存储、提供集群ARN、数据库连接信息和存储嵌入的目标字段。Bedrock然后从文档生成嵌入并将其安装到Aurora集群中,使用户能够与Bedrock代理聊天并查询存储在Aurora中的知识库。

Carter强调,虽然有许多支持向量的数据库可用,但客户通常更倾向于使用现有数据库,以利用熟悉度、避免额外许可、减少数据同步需求,并简化将向量数字转换回文本的过程,将它们与地面真实数据一起存储。

在亚马逊云科技的产品组合中,向量相似性搜索功能正被添加到所有数据库,目前已有7个产品支持:Amazon OpenSearch、Aurora PostgreSQL with PG Vector、RDS PostgreSQL with PG Vector、Amazon MemoryDB(预览版)、Amazon Neptune Analytics、Amazon DocumentDB(预览版)和Amazon DynamoDB与OpenSearch的零ETL集成。

Carter强调了这一领域创新的快速步伐,仅在90天内,针对向量相似性搜索工作负载,Amazon优化的PG Vector读取性能就提高了20倍。

亚马逊云科技的数据迁移服务(DMS)在迁移超过100万个数据库方面发挥了重要作用,仅今年就有超过34万次迁移。亚马逊云科技正在开发Fleet Advisor等工具,为迁移工作提供T恤尺码(小、中、大)建议,帮助客户确定优先级并了解在不同数据库技术之间移动所需的工作量级。此外,Schema Conversion Tool(SCT)的改进以及数据和查询测试的自动化也在开发中,以确保无缝的迁移体验。

今年,亚马逊云科技已对PostgreSQL、MySQL、MariaDB和Redis等开源社区做出了超过550项被接受的贡献,体现了其作为这些技术良好管理者的承诺。

最后,Carter重申了亚马逊云科技提供合适工具、拥抱Serverless作为新常态、确保性能和可扩展性,以及促进应用程序的互操作性和全球规模的承诺。这次全面的演示展示了亚马逊云科技的数据库产品、创新和利用数据和生成式AI为未来应用程序赋能的愿景。

下面是一些演讲现场的精彩瞬间:

亚马逊云科技公司在reInvent 2024大会上强调,拥抱变革是进步的前提条件,尤其是在过去几年里,我们的业务和生活都经历了巨大变化。

亚马逊Neptune Analytics通过将数据保存在内存中并利用高性能文件系统,可以实现高速读写和快速分析,适用于临时应用和发现社交网络中的关键影响者等场景。

亚马逊Aurora无限数据库将通过分片解决方案在多个Aurora Serverless v2实例之间分发数据,实现自动扩缩容,优化性能和成本。

亚马逊推出了新的Amazon ElastiCache for Redis服务,可根据工作负载自动扩缩容,并透明地进行软件更新,极大简化了缓存管理。

在短短几分钟内,我们从共享驱动器读取文档、向量化并存储到矢量数据库中,再结合大型语言模型,实现了基于知识库的检索增强生成工作流程。

亚马逊正在开发名为”Fleet Advisor”的工具,可以评估您的数据库迁移工作量,并为您提供优先级建议。

我们持续致力于为您和客户提供正确的工具,确保系统以您期望的卓越运营方式运行,无服务器是我们的新常态,系统可以自动扩展和缩减,无需预先配置CPU和内存。

总结

在这场引人入胜的演讲中,亚马逊云科技高管们阐述了他们在数据库和数据管理领域拥抱变革和进步的愿景。核心主题围绕着让客户专注于自身业务目标,而亚马逊云科技则负责处理数据基础设施的复杂性。

首先,Rahul Pathak强调在不中断现有系统的情况下拥抱变革的重要性,突出了亚马逊云科技在无缝容量扩展、按使用付费模式以及托管数据库(如Aurora和DynamoDB)方面的承诺。他强调了使客户能够抽象出数据并专注于业务目标的目标。

其次,Jeff Carter深入探讨了亚马逊云科技全面的关系型和非关系型数据库产品组合,包括新推出的RDS DB2和Amazon Neptune Analytics。他展示了诸如Aurora Limitless Database用于大规模数据库、ElastiCache Serverless用于无缝缓存以及与Redshift的零ETL集成等创新。值得注意的是,他演示了亚马逊云科技如何在七种数据库产品中集成向量相似性搜索功能,从而支持生成式AI应用程序。

第三,来自Heroku的Gail Fredericks分享了他们与亚马逊云科技的合作伙伴关系,将整个Postgres车队迁移到Amazon Aurora。这一过渡使Heroku客户获得了更好的弹性、容错能力以及扩展到数据分析和AI的能力。

最后,演讲以号召行动作为总结,强调亚马逊云科技在运营卓越、无服务器计算、大规模可靠性能以及跨服务互操作性方面的承诺。高管们强调了他们对开源社区的奉献以及持续创新的决心,确保客户能够拥抱进步,同时保持现有系统的完整性。

亚马逊云科技(Amazon Web Services)是全球云计算的开创者和引领者。提供200多类广泛而深入的云服务,服务全球245个国家和地区的数百万客户。亚马逊云科技致力于成为企业构建和应用生成式AI的首选,通过生成式AI技术栈,提供用于模型训练和推理的基础设施服务、构建生成式AI应用的大模型等工具、以及开箱即用的生成式AI应用。深耕本地、链接全球 – 在中国,亚马逊云科技通过安全、稳定、可信赖的云服务,助力中国企业加速数字化转型和创新,并深度参与全球化市场。

内容概要:本文介绍了一个基于多传感器融合的定位系统设计方案,采用GPS、里程计和电子罗盘作为定位传感器,利用扩展卡尔曼滤波(EKF)算法对多源传感器数据进行融合处理,最终输出目标的滤波后位置信息,并提供了完整的Matlab代码实现。该方法有效提升了定位精度与稳定性,尤其适用于存在单一传感器误差或信号丢失的复杂环境,如自动驾驶、移动采用GPS、里程计和电子罗盘作为定位传感器,EKF作为多传感器的融合算法,最终输出目标的滤波位置(Matlab代码实现)机器人导航等领域。文中详细阐述了各传感器的数据建模方式、状态转移与观测方程构建,以及EKF算法的具体实现步骤,具有较强的工程实践价值。; 适合人群:具备一定Matlab编程基础,熟悉传感器原理和滤波算法的高校研究生、科研人员及从事自动驾驶、机器人导航等相关领域的工程技术人员。; 使用场景及目标:①学习和掌握多传感器融合的基本理论与实现方法;②应用于移动机器人、无人车、无人机等系统的高精度定位与导航开发;③作为EKF算法在实际工程中应用的教学案例或项目参考; 阅读建议:建议读者结合Matlab代码逐行理解算法实现过程,重点关注状态预测与观测更新模块的设计逻辑,可尝试引入真实传感器数据或仿真噪声环境以验证算法鲁棒性,并进一步拓展至UKF、PF等更高级滤波算法的研究与对比。
内容概要:文章围绕智能汽车新一代传感器的发展趋势,重点阐述了BEV(鸟瞰图视角)端到端感知融合架构如何成为智能驾驶感知系统的新范式。传统后融合与前融合方案因信息丢失或算力需求过高难以满足高阶智驾需求,而基于Transformer的BEV融合方案通过统一坐标系下的多源传感器特征融合,在保证感知精度的同时兼顾算力可行性,显著提升复杂场景下的鲁棒性与系统可靠性。此外,文章指出BEV模型落地面临大算力依赖与高数据成本的挑战,提出“数据采集-模型训练-算法迭代-数据反哺”的高效数据闭环体系,通过自动化标注与长尾数据反馈实现算法持续进化,降低对人工标注的依赖,提升数据利用效率。典型企业案例进一步验证了该路径的技术可行性与经济价值。; 适合人群:从事汽车电子、智能驾驶感知算法研发的工程师,以及关注自动驾驶技术趋势的产品经理和技术管理者;具备一定自动驾驶基础知识,希望深入了解BEV架构与数据闭环机制的专业人士。; 使用场景及目标:①理解BEV+Transformer为何成为当前感知融合的主流技术路线;②掌握数据闭环在BEV模型迭代中的关键作用及其工程实现逻辑;③为智能驾驶系统架构设计、传感器选型与算法优化提供决策参考; 阅读建议:本文侧重技术趋势分析与系统级思考,建议结合实际项目背景阅读,重点关注BEV融合逻辑与数据闭环构建方法,并可延伸研究相关企业在舱泊一体等场景的应用实践。
内容概要:本文围绕“考虑灵活性供需不确定性的储能优化配置”展开,基于Matlab代码实现,研究在电力系统中因可再生能源出力波动和负荷变化带来的灵活性供需不确定性条件下,储能系统的优化配置方法。通过构建数学模型,结合智能优化算法(如粒子群、遗传算法等)对储能的位置、容量及运行策略进行联合优化,旨在提升系统对不确考虑灵活性供需不确定性的储能优化配置(Matlab代码实现)定性的适应能力,增强电网稳定性与经济性。文中还涉及多场景仿真分析与概率性建模,以应对风光出力与负荷需求的随机波动,确保优化结果具有鲁棒性和实用性。; 适合人群:具备一定电力系统基础知识和Matlab编程能力的研究生、科研人员及从事新能源、微电网、储能系统设计的工程技术人员;尤其适合研究能源系统优化、不确定性建模与智能算法应用的相关人员。; 使用场景及目标:①解决高比例可再生能源接入背景下电力系统灵活性不足的问题;②指导储能系统在配电网或微电网中的科学规划与配置;③掌握如何在不确定性环境下建立鲁棒优化或随机优化模型,并通过Matlab实现求解;④为综合能源系统、电动汽车集群调度等类似问题提供方法参考。; 阅读建议:建议结合文中提供的Matlab代码进行实践操作,重点关注模型构建逻辑、不确定性处理方式(如场景生成、概率分布拟合)以及优化算法的选择与参数设置,同时可扩展学习YALMIP、CPLEX等工具在电力系统优化中的应用。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值