• 博客(2122)
  • 资源 (9)
  • 收藏
  • 关注

原创 企业DevOps探讨:“谁构建、谁运行”原则的理论基础

“谁构建,谁运行” --沃纳·沃格尔这样的场景大家想必不会陌生:我们正与家人共度美好时光,突然刺耳的电话铃声嗡嗡响起,我们的注意力也为之吸引。听筒中的尖叫声告知,我们的应用程序——也就是那些定期受到内存泄漏侵扰、但重启之后又能恢复正常的小冤家们——现在终于彻底起义了,服务器资源在几分钟之内就被其彻底榨干。目前该应用已经无法正常起效,而运维团队除了尝试重启与回滚之外无法可想——而最新

2015-12-30 15:18:26 9476

原创 企业DevOps:实施过程中需要关注的各项要点

作者:亚马逊云科技企业市场战略总监Stephen Orban“经验并非凭空创造,而是依靠点滴积累所实现” ---阿尔贝·加缪在此次的企业DevOps探索之旅系列文章当中,我将带大家一同探讨企业在具备一定DevOps经验之后又该如何处理下一步可能面临的状况。当然,这些只是我个人在接触自动化、面向客户服务之IT体系以及“谁构建、谁运行”方面事务的同时积累下的一些心得体

2015-12-29 19:36:50 8098

翻译 将DevOps纳入企业环境引发的思考

作者:亚马逊云科技企业市场战略总监Stephen Orban“发展是一种以渐进式改善为载体的持续性行为”——英德拉瓦蒂虽然DevOps可以算是相对新鲜的概念,不过在我看来、其本质思路很早之前就已经出现。从这个角度看,目前很多企业已经广泛接纳这一概念并将其作为文化性产物看待,具体而言就是将大量原本孤立的团队融合起来,从而实现速度更快、频率更高且更为可靠的工作成果。我个人非常幸运

2015-10-13 17:38:41 6369

翻译 利用Amazon Machine Learning与Amazon Redshift建立二进制分类模型

日常生活中的大部分决策都以二进制形式存在,具体来说就是这类问题能够以是或者否来回答。而在商业活动中,能够以二进制方式回答的问题也有很多。举例来说:“这种情况是否属于交易欺诈?”,“这位客户是否会购买该产品?”或者“这位用户是否存在流失风险?”等等。在机器学习机制中,我们将此称为二进制分类问题。很多商业决策都能够通过准确预测二进制问题的答案来得到强化。Amazon Michine Learning(

2015-09-07 17:10:46 8277

翻译 利用Amazon Mobile Analytics与R深入探究移动应用的使用模式

作者:Sandeep Atluri 亚马逊数据科学家要真正鼓励用户使用我们的移动应用程序,最重要的前提就是深入了解用户使用应用程序时的行为模式,而后据此作出体验优化。不过通过应用程序事件数据来找出有意义的模式往往极具挑战性,而标准KPI所提供的诸如月度活跃用户(简称MAU)以及每日活跃用户(简称DAU)并不足以勾勒出完整的图景。举例来说,所发布应用在过去三十天中的用户开启次数能够帮

2015-08-31 18:33:41 6815

翻译 亚马逊云科技使用心得:当初我曾错过的那些宝贵经验

在今天的文章中,我整理出了大量当初曾经错过、而至今仍将我追悔莫及的亚马逊云科技(Amazon Web Services)使用心得。在几年来的实践当中,我通过在亚马逊云科技之上新手构建及部署各类应用程序而积累到了这些经验。虽然内容有些杂乱,但相信仍然能给各位带来一点启示。从物理服务器向“云环境”转移的过程不仅仅是一项技术任务,同时也意味着我们的思维方式需要作出针对性的转变。总体而言,在物理环境下我们

2015-07-08 22:52:17 28820

转载 成本高?效率低?S3 Tables帮你搞定日活数据分析!

如何在控制成本降低运维复杂度的同时,快速从海量日活数据中提取有价值的业务洞察,已成为决定竞争优势的关键因素。提供100%兼容开源Spark的环境,同时针对亚马逊云科技环境进行了性能优化,为数据分析任务提供强大且灵活的计算能力。可以加速从数据采集到业务洞察的全流程,使企业能够更敏捷地响应市场变化,做出数据驱动的决策,实现数据价值的最大化。本文介绍的架构充分利用了亚马逊云科技的优势,构建了一个高效、低成本且易于维护的数据分析平台。的组合,实现了完全自动化的作业调度,无需手工操作即可触发Spark作业,采用。

2025-06-09 14:00:00 10

原创 准确率从 19% 提升至 95%!文本审核模型优化的三个阶段实践(上)

第二阶段则在此基础上,通过精细化的提示词设计,进一步挖掘和解决了潜在的误判问题,使得审核系统的准确率得到了更为显著的提升。随着提示词的不断细化和业务规则的增多,系统的复杂性急剧上升。同时,三步串行调用 Claude 模型进行审核的方式,不仅造成了较高的 API 调用成本,在面对高并发请求时,系统性能也会出现明显的瓶颈,难以满足大规模业务场景下的高效审核需求。在抽样过程中,着重保证样本能够涵盖不同类型的内容,囊括丰富多样的表达方式,同时兼顾不同语言以及文化背景下的用户资料,以此获取多元且具典型性的分析样本。

2025-06-09 09:38:13 555

转载 推出全新API模型资源库!可轻松构建MCP Server

Smithy模型可用于更深入地理解亚马逊云科技服务,并助力开发者构建工具,例如自定义SDK和CLI,以便连接亚马逊云科技服务,或构建测试工具来验证应用程序在亚马逊云科技上的集成情况。的更多信息,请参阅“在亚马逊云科技上构建的工具”页面,以及各SDK对应的支持代码库,或通过您常用的亚马逊云科技支持渠道获取帮助。:您可以基于亚马逊云科技服务构建自有工具,例如模拟测试工具、IAM策略生成器,或是用于连接亚马逊云科技服务的高级抽象工具。支持的语言社区,量身构建专用的定制SDK,并生成客户端SDK库。

2025-06-07 11:02:00 12

转载 一招制胜!Amazon Bedrock搞定多租户架构成本追踪难题

设置完成后,配置文件可添加自定义成本分配标签,为每个租户提供唯一标识,从而实现对特定租户的资源使用情况和相关成本进行精确追踪。)来过滤特定租户的使用情况和成本。在亚马逊云科技控制台中,导航至“账单与成本管理”服务,在“成本与使用量分析”下选择“Cost Explorer”,然后挑选Amazon Bedrock服务。此外,在亚马逊云科技账单与成本管理服务中,您可通过“成本与使用量分析”下的“数据导出”,将亚马逊云科技服务成本和使用情况报告(CUR)导出到Amazon S3存储桶中。由于在多租户环境中,

2025-06-06 17:00:00 28

原创 Amazon Bedrock 助力 SolveX.AI 构建智能解题 Agent,打造头部教育科技应用

同时其他类型的题目将被路由到各自的模型处。Amazon Bedrock 的跨区域推理功能进一步提升了系统的可靠性和性能,通过智能地将流量动态路由到多个区域,确保在需求高峰期获得更高的吞吐量和增强的弹性。SolveX.AI 是一款由 PIGEON LIMITED 开发的教育类应用,在教育类 APP 中表现出色,位居前列,收获了众多用户的好评,评分高达 4.9 分,主打学习辅导,涵盖数学、科学、英语、历史等多学科,无论是应对学校课程,还是准备 SAT、ACT、AP、IGCSE 等考试,都能提供有效帮助。

2025-06-06 14:25:25 723

转载 MCP实战:Bedrock+Nova Act构建对话式天气智能体

将MCP作为LLM和数据源之间桥梁的这一模式,可以应用于天气之外的许多其他领域,为构建智能、数据驱动的多智能体应用,开辟令人兴奋的可能性。智能体天气助手将使用Amazon Bedrock上的LLM来理解您的查询,选择适当工具,并根据香港天文台网站的实时数据提供有意义的回答。这种架构展示了MCP如何作为连接AI模型与外部系统的标准化接口,从而能够创建强大的、具有上下文感知的应用程序。,通过整合Amazon Bedrock上的LLM的强大能力,创建一个真正智能的天气数据智能体应用。

2025-06-06 11:02:56 30

转载 全球移动办公挑战重重?送你可落地的云上解法指南!

西云数据解决方案架构师,主要负责支持企业客户上云,专注于亚马逊云解决方案设计和技术咨询,15余年软件开发、项目交付、售前咨询等丰富的行业实践经验。亚马逊云科技解决方案架构师,擅长系统交付、运维和解决方案设计,对于传统IT技术以及云计算技术有深入了解和丰富的实战经验。本文从全球移动办公面临的挑战入手,通过引入亚马逊云科技的不同服务,逐步解决了这些问题,并以Demo的形式进行了展示。亚马逊云科技高性能计算专业解决方案架构师,专注于协助客户在亚马逊云科技上构建经济、可持续的高性能计算解决方案。

2025-06-05 11:58:00 29

转载 FSx for Lustre推出全新存储类别,成本可降96%!

运行地震成像工作负载,或诸如天气预报、高级驾驶辅助系统(ADAS)训练或基因组学分析等其他高性能计算(HPC)工作负载的客户,通常将海量数据存储在基于硬盘驱动器(HDD)、或HDD与固态硬盘(SSD)组合的本地文件存储系统中。能够根据数据访问模式,自动将冷数据分层存储到适用的低成本存储层级,以此优化成本,同时它还包含一个可选的SSD读缓存,可提升对延迟最敏感的工作负载的性能。无论您是从数GB的实验数据起步,还是处理PB级的大型数据集,以应对最苛刻的人工智能与机器学习和HPC工作负载,

2025-06-05 11:58:00 23

原创 使用 Amazon Q Developer CLI 调用 MCP Server 实现 Amazon Support 案例自动创建

从中不难看出,Amazon Q Developer CLI 整合 MCP 能力之后,增加了无限的想象空间,借以本文抛砖引玉,读者可以结合自己实际工作中的场景,借助 GenAI 的强大能力,参考本文的例子,创造出更多的 MCP Server,打造一个性化十足的专属 Amazon Q Developer CLI,提升自己的工作效率,更好地拥抱这个 GenAI 的时代。有关 MCP 的介绍可以参考。最后,本测试代码运行在 Python 3.12 环境中,并保证安装 uv, 有关 uv 相关的介绍以及安装,可以。

2025-06-05 09:39:23 1010

转载 模型推理性能评估成瓶颈?Inferentia2带你高效起飞!

是一个广泛用于LLM性能测试的数据集,包含了客户和LLM之间的真实对话数据,用于评估在不同输入长度下的性能表现,测量模型的吞吐速度和生成速度。等核心技术在保持低延迟的同时,显著提升LLM服务的吞吐量,并且大幅降低内存开销,解决LLM推理受限于显存由于带宽或者成本的带来的容量限制。P99延迟约10秒,P50延迟为5秒,平均延迟呈上升趋势,从0.5秒上升到5秒,说明随着时间的推移,系统负载可能在增加。可以有效评估模型部署的性能表现,及时发现系统瓶颈,优化资源配置,在保证用户体验的同时,有效控制成本。

2025-06-04 17:00:00 24

转载 Aurora DSQL全面上线,提供MCP Server开发更高效

多区域集群不仅能够提供与单区域集群相同的扩展性和连接能力,还通过两个区域端点(每个互连集群区域各有一个端点)提升了可用性。同时,您还需要选择一个“见证区域”,该区域将接收写入到任何对等连接区域的数据,但不具备访问端点,然后选择“创建集群”。对于单区域集群和多区域集群(包含两个对等区域和一个见证区域),支持美国东部(北弗吉尼亚州)、美国东部(俄亥俄州)以及美国西部(俄勒冈州)区域。至此,多区域集群已成功创建。要创建多区域集群,您需要将另一集群的Amazon ARN添加进来,以实现集群间的对等连接。

2025-06-04 11:01:27 32

原创 使用 Amazon Q Developer CLI 快速搭建各种场景的 Flink 数据同步管道

在 AI 和大数据时代,企业通常需要构建各种数据同步管道。例如,实时数仓实现从数据库到数据仓库或者数据湖的实时复制,为业务部门和决策团队分析提供数据结果和见解;再比如,NoSQL 游戏玩家数据,需要转换为 SQL 数据库以供运营团队分析。那么,到底如何构造稳定而快速的数据 ETL 管道,并且可以进行数据合并或转换?📢限时插播:Amazon Q Developer 来帮你做应用啦1!🌟10分钟帮你构建智能番茄钟应用,1小时搞定新功能拓展、测试优化、文档注程和部署⏩快快点击进入《》实验。

2025-06-04 08:54:30 948

转载 专用MCP Servers,让AI助手更懂容器和Serverless!

此外,该服务器还为基础设施即代码的决策、功能、知识库以及集群状态信息的访问权限,从而使得AI代码助手在从初始设置到生产部署的整个应用程序生命周期中,都能提供更加准确、量身定制的指导。您可以使用这些开源解决方案,在构建和部署过程中借助亚马逊云科技的功能和配置的最新知识,更快速地开发应用程序。几分钟后,您已经拥有了一个完整的容器化应用程序,从Amazon S3存储桶到所有必要的网络配置均已准备就绪。能够提供当前上下文信息以及特定于服务的指导,从而帮助您避免常见的部署错误,并实现更准确的服务交互。

2025-06-03 11:01:23 30

原创 基于 Amazon Q Developer CLI 和 Amazon Bedrock Knowledge Bases 实现智能问答系统

这个问题在不同业务场景下可能有完全不同的答案。这样做的原因是,网站中有多个“business”的字样,如果不做特别说明,LLM 通常会根据开发习惯猜测点击时使用的 selector,将该参数传递给 Playwright 工具,当与实际情况不符时,Playwright 往往难以点击到正确的链接。同时,结合 Amazon Bedrock Knowledge Bases 的元数据过滤功能,我们可以首先基于历史会话对问题进行分类,在准确的类别中再完成知识库的搜索和答案生成,进一步提升 Q&A 回复的准确率。

2025-06-03 08:59:06 1024

转载 模糊描述还能查找视频?Amazon Bedrock来真的!

从输出结果角度,Amazon BDA支持标准结果和自定义结果的输出,当用户选择自定义结果的输出时,可以用prompt的方式去生成想要的结果。技术,运用AI自动剖析视频内容,提取关键信息,通过向量搜索达成语义智能匹配,实现多角度(视频关键字、台词、场景描述)视频检索,有利于提升用户搜索效率,增加平台活跃度,也为视频创作者创造更多曝光机遇。Shots:是BDA自动将视频分割成多个镜头,每个镜头包括开始和结束的时间码,开始和结束的时间戳(毫秒),开始和结束的帧索引,持续时间,置信度,所属章节索引。

2025-05-30 11:01:41 28

原创 翰德 Hudson 携手亚马逊云科技,基于 MCP Agent 重塑智能招聘新范式

翰德 Hudson 的实践为人力资源行业数字化转型提供了可复制的范例,推动了生成式 AI 在招聘垂直领域的创新应用,构建了人机协作的新模式,助力行业迈向更加智能、高效的未来。无服务器架构 Amazon Lambda 或 AWS Fargate 的弹性伸缩能力应对高峰时期的并发请求,Amazon Lambda 按照调用次数收费,不会造成空闲资源浪费, 适合无状态的 MCP Server,而 Amazon Fargate 可以提供物理隔离的容器环境,适合有状态的 MCP Server;

2025-05-30 09:23:05 993

转载 教你构建音视频直播审核方案,效率与准确率双提升!

7.音频审核的Amazon SQS触发Audio ModerationLambda,首先调用Amazon SageMaker中的Whisper进行语音识别,然后调用Amazon Bedrock中的模型进行审核。亚马逊云科技解决方案架构师,负责基于亚马逊云科技的云计算方案的架构设计,同时致力于亚马逊云科技的云服务在移动应用与互联网行业的应用和推广。在亚马逊云科技上,除传统虚拟机外,还支持通过A。从直播流中截取图片或视频(直播视频的视觉审核,可通过截取直播视频中的图片或者短视频进行审核)、音频文件存入。

2025-05-29 11:02:35 33

转载 8大招式!Amazon SageMaker花式解决模型部署难题

在推理管道模型中,您添加到容器中的处理步骤,既可以是针对模型输入和输出的处理脚本,也可以结合使用内置算法和自定义算法,所有这些步骤都会按照顺序依次执行。如果您正在使用基于同一机器学习框架构建的多个模型,且这些模型使用频率不高,也无需单独的自动扩展策略(因为这些模型共享同一个容器和底层计算资源,所以它们会作为一个整体单元共同进行扩展),那么该方式将非常适用。提供了非常精细的方式,来配置机器学习工作负载的部署策略,并可简化机器学习模型落地生产系统的流程,提供了一套完全托管且高可用的基础设施,能够满足各种需求。

2025-05-28 11:01:31 34

原创 从零开始:使用 Amazon Q CLI 开发一款软件

过长的代码可能导致 Q 阅读和修改代码的时候,只是进行了局部操作,忽略上了过长的上下文,导致局部逻辑正确,整体代码结构错乱,例如在一个 500 行的 python 代码中修改曾经出现,修改后的代码片段“缩进格式不正确”,然后 Q 会反复尝试修改以最小修改量来修复这个错误,最后花了很多时间迭代数十次才完成任务。根据测试,我们可能会发现,工具只是简单从 java 的 pom.xml 中解析了<dependency>中的依赖,但是没有检查依赖包的子依赖。工具需要支持 python,nodejs,java。

2025-05-28 09:22:13 919

转载 从愿景到现实,这届中国峰会你不容错过!

2025年,是生成式AI从概念到实际商业价值的“落地之年”,2025中国峰会从愿景到现实,聚焦生成式AI的全球实践,连接千行百业的管理者、开发者、创业者,点燃多维互动的创新火花。当科技遇见她的远见,当创新融入女性力量。首届女性论坛中,来自多元领域的卓越女性,将分享她们在AI时代的创新实践与蝶变故事,从技术突破到行业变革,从商业价值到社会责任,以跨界思维碰撞创新火花,,国内外独角兽企业实战分享前沿技术与产品,与行业专家共同探讨技术、增长、安全与创新,倾力打造与大型企业的沟通桥梁,助力初创企业加速成长。

2025-05-27 11:02:39 43

转载 如何解决Agent集成难题?MCP Server运行教程带你搞定!

而言,若要成功完成诸如“安排一次领养狗狗的预约”或“为代码添加一项功能,以便让用户可以安排领养狗狗的时间”等任务,就需要访问AI系统之外的相关信息或资源。最初,出于多种原因,MCP规范采用了有状态的网络协议(SSE),其中包括部分集成场景需要向客户端与Agent发送各类更新信息,例如工具列表发生变化的情况。随着技术的不断发展,诸多令人振奋的事情正在开发领域上演,而其中最引人瞩目的,莫过于将AI集成到系统和开发工具的各个不同部分,正变得愈发容易。的方式,涉及MCP规范中概述的“传输方式”。

2025-05-26 11:01:23 30

转载 视频界的火眼金睛!构建视频相似性自动化检测方案

亚马逊云科技解决方案架构师,负责基于亚马逊云科技的云计算方案的架构设计,同时致力于亚马逊云科技的云服务在移动应用与互联网行业的应用和推广。传统的视频检测方式主要依赖视频标题、描述或者简单的规则匹配,无法应对数据量激增和不断变化的内容特性。因为不同的业务场景对相似视频的定义不同(例如有的业务场景下,视频颜色变化后属于创新作品,而不应被认为相似作品),利用余弦相似度等算法,对视频间的特征向量进行比对,计算出相似度得分,判断视频内容的相似程度。架构,充分利用亚马逊云科技的众多服务,简要的系统架构如下图所示。

2025-05-26 11:01:23 29

原创 利用生成式 AI 加速应用程序 Operational Readiness Review(ORR)流程

运营就绪审查(ORR)是一个结构化的评估过程,用于确定应用程序或系统是否已准备好投入生产环境。ORR 通常涵盖多个关键领域,包括:安全性与合规性可靠性与弹性性能与效率可操作性与可维护性成本优化ORR 的目标是在应用程序部署前识别并解决潜在问题,确保系统能够满足业务需求和技术标准。在做 ORR 的时候,运维和开发团队的负责人需要在公司统一的审查标准之上,对应用程序的各个方面进行审查,并最终生成报告。

2025-05-26 09:47:38 780

转载 Claude Opus 4和Sonnet 4模型,全面上线Amazon Bedrock!

虽然现有模型响应迅速且流畅,但要在较长时间内,尤其是在编码、研究或企业工作流程等领域,始终保持逻辑的连贯性以及上下文的一致性,仍然颇具挑战。例如,开发者可以设定一个最大token数量作为限制条件,模型处理任务时,则会在该token数量范围内进行深度思考与推理,从而既能在一定程度上保证响应速度,又能尽可能提供更深入、更精准的答案。在多Agents系统中,Sonnet 4作为专门处理特定任务的子Agent表现出色,能够承担诸如针对性代码审查、搜索与检索等职责,或在更广泛的流程中,负责独立功能的开发工作。

2025-05-23 12:30:22 68

原创 提升开发运维效率:原力棱镜游戏公司的 Amazon Q Developer CLI 实践

找到GuideNavigationContext.cs 然后里面有UIManager.CreateView的调用,我现在需要异步编程,所以我写了一个新的UIManager.CreateViewAsyncUniTask,我现在需要你帮我把GuideNavigationContext.cs里面的同步改异步,UniTask你可以从工程里找到,你试试吧。最后,CLI 提供了完整的操作总结,包括所创建资源的概览、如何访问服务的说明,以及生成的 update_pod.sh 脚本使用说明。

2025-05-23 09:52:37 972

转载 省省吧!教你一招搞定Amazon MSK流量成本优化难题

写入端向主题中发送的消息可以大致均衡的分布在这个主题的多个分区上;每个分区的主副本分区负责承载写入端的写操作和消费端的读操作,其他的副本分区在Kafka集群内部同步主副本的消息,为2时,Producer(写入端)向Amazon MSK写入的消息会先送达到分区主副本所在的节点,然后消息会在Amazon MSK集群内部自动向另外的2台分区副本所在的节点同步;集群的消费端,可以在同可用区内就近消费分区中的数据,该特性允许消费端从副本分区所在的节点进行数据拉取并消费,而以往消费端只能在主副本分区上进行数据拉取。

2025-05-22 11:01:42 35

转载 依赖包生命周期管理太难?Amazon Q CLI来帮你!

添加扫描进度条,提取项目名在扫描报告中,扫描的报告需要支持text、json、html格式,扫描结果的不同状态用emoji进行表示。”拆分后的短小代码,在后续的修改中成功率会更高,步骤数更少。过长的代码可能导致Amazon Q阅读和修改代码时,只进行局部操作,而忽略过长的上下文,导致局部逻辑正确,整体代码结构错乱。例如在一个500行的python代码中修改曾经出现类似情况,修改后的代码片段“缩进格式不正确”,然后Amazon Q会反复尝试修改以最小修改量来修复该错误,最后花了很多时间迭代数十次才完成任务。

2025-05-22 11:01:42 37

转载 零基础教程|Bedrock+DeepSeek快速搭建企业智能客服系统

本教程专注于Flask应用的本地搭建和功能实现,适合希望在本地环境中测试和开发智能客服系统的企业用户。对于未来计划将系统部署到微信公众号、网页客服或内部系统的用户,Flask应用也可以作为后端服务,便于与这些平台进行集成。调用了DeepSeek模型,并基于预设的知识库提供了准确的回答。”时,系统会结合上传的考勤制度文件,生成详尽的解答。因此,如果确定短期内不再使用该知识库,建议按照以下顺序清理资源,以避免产生不必要的费用。如果没有DeepSeek模型的使用权限,可点击页面上的“申请”按钮获得权限。

2025-05-21 11:02:21 43

转载 云效账单分析利器!Amazon CUR助您轻松掌控云成本

打开控制台,在「账单」服务界面下,点击菜单上的「账单」,就能看到按服务拆分的账单。对于预留实例,真实使用的实例,其费用显示会是0,用户在统计的时候就不会把这些统计进去,但还是能看到预留实例优惠的实际应用情况,,这个指的是账单发票ID,而更实际的意义,是代表这个账单是否已经正式出具,等待客户付款。通过VCPU小时数,可以避开机型的影响,更真实地看到业务量的变化。需要注意的是,CUR报告默认是不打开的,并且也无法追溯以往的记录,只有用户手动打开之后,详细的用量数据才会被导出到指定的Amazon S3桶。

2025-05-21 11:02:21 42

原创 基于亚马逊云科技构建音视频直播审核方案

随着互联网内容形态的多样化发展,用户生成内容(UGC)呈现爆发式增长。社交平台、直播、短视频、语聊房等应用场景中,海量的音视频内容需要进行实时审核,以维护平台安全与用户体验。然而,企业在构建审核系统时通常面临以下挑战:审核准确性:需要精准识别多种媒介中的违规内容,减少误判率实时性要求:在直播等场景要求尽可能快地获取结果成本压力:审核成本高昂,自建审核平台投入大规则定制:不同场景下的审核标准各异,需要灵活配置系统稳定性:需要支持高并发且保证服务可用性。

2025-05-21 09:03:55 1121

转载 三步打造物流数据湖方案,数据存储与查询效率飞升

Amazon S3的高可用性和弹性存储能力,结合Redshift的列式存储和大规模并行处理(MPP)架构,使得复杂查询的响应时间大幅缩短,用户能够在几秒钟内获取所需数据,从而提升决策效率。:随着2B业务的发展,需要维护的数据库数量不断增加,DB之间的相互调用加大了数据接口管理复杂性,同时自建DB的可用性挑战越来越大。WMS的主要功能有入库管理,出库管理,库存管理,并对接订单数据与物流数据,提供物流送达数据分析与报表,打造无缝的技术体验。,系统可以自动发现数据源并生成元数据,方便后续的数据分类和搜索。

2025-05-20 11:02:03 40

转载 MCP+Amazon Bedrock协作,模型调用更灵活、更智能!

1.阅读网页并进行内容总结对人类而言,是一项很简单的任务,但大语言模型(LLM)通常无法像人类一样主动访问网页,也无法获取其参数记忆之外的信息。为了演示这个过程,本文会在当前的服务器文件中加入几个非常实用的功能,并展示Claude如何智能地将它们组合使用,同时准确地区分各个工具的作用。请求从给定的URL获取内容的工具。发送请求,传递对话历史、可用工具和模型配置参数,以获取来自基础模型的响应,处理下一轮对话。3.对于工具的使用,它调用工具处理程序,并使用工具的结果向Amazon Bedrock发起新的请求。

2025-05-20 11:02:03 38

原创 Amazon Bedrock 上的模型擂台赛:Nova、Claude,谁是最强图片/视频审核大模型?

本文将使用相同的视频图像审核测试数据集,从审核准确率、误报率、漏报率等多项指标全面评估亚马逊云科技 Amazon Bedrock 上三款多模态大模型的表现差异,这包括亚马逊自研大模型 Nova 系列的 Lite 和 Pro 模型、Anthropic 的 Claude 3.7 Sonnet 模型,对比分析不同模型在色情内容和暴力内容审核场景下的优势,为您选择和构建合适的基于大模型的内容审核解决方案提供洞见与参考。Nova Lite 对色情图片的检测准确率为 50%,对暴力图片的检测准确率为 88.33%

2025-05-20 08:25:47 734

转载 数日即可构建Agent?Strands Agents说到做到!

尽管LLM的性能逐渐提高,但这些改进并不意味着可以利用现有的框架更快地构建和迭代Agent,Clare团队仍需花费数月时间让一个Agent达到生产可用的状态。为了完成Agent原型的开发和部署,Clare团队不得不依赖各种复杂的Agent框架库,这些库能够为Agent提供所需的基础架构和编排能力,确保其在早期模型中能可靠的完成任务。在每次循环中,Strands会将提示词、Agent上下文以及Agent工具的描述信息,一并传递给LLM。例如,可在Lambda函数中运行Agent工具,同时在。

2025-05-19 17:30:00 151

如何在亚马逊云科技云服务上构建千万级用户应用

这个演讲将讨论如何如何充分利用云平台的特性和亚马逊云科技的相关服务来构建一个可以支撑千万级用户的应用。通过讨论不同用户数量级别的应用需求和架构特点,然后结合不同的亚马逊云科技云服务来满足用户访问,并最终逐渐把架构优化成为可以支持千万级用户的设计。这个演讲的目的是帮助对AWS服务有一定基础的用户进一步理解服务之间的差异以及基于AWS云平台构建高扩展性应用的关键服务及其使用注意事项。

2015-09-22

方国伟:基于亚马逊云科技的云灾备设计

通过基于亚马逊云科技云服务构建灵活、低成本的灾备方案,给企业带来一个保障业务连续性的创新方法。有研究表明,相对于传统灾备方案,基于云计算的灾备方案可以帮助企业最多节约85%的成本。在这个讲座中,我们首先讨论与灾备方案相关的亚马逊云科技基础服务,包括计算、存储、网络和数据库服务;然后我们会从技术的角度讨论常见的灾备架构以及它们的具体实现方式,从备份/恢复、“信号灯”方式、热备方式到多站点方式。

2014-05-29

Netflix在亚马逊云科技上的应用和创新

从2009年开始,Netflix逐渐把她的IT系统迁移到亚马逊云科技云服务,并开始进行业务转型——从DVD租赁演变为在线视频供应商。目前,在高峰期间Netflix的互联网下载流量已经占到北美地区的三分之一,而支撑Netflix的整个IT系统基本上构建在亚马逊云科技云上。

2014-05-29

360度解析亚马逊云科技存储服务V2

综合使用多种亚马逊云科技的存储服务能够帮助用户构建出一个高可用、弹性和可扩展的云计算应用。这个在线讲座将从互联网时代数据存储的多种需求出发,逐一讲解亚马逊云科技所提供的多种数据存储服务,包括完全基于非结构化数据存储的简单存储服务(S3),侧重于磁盘性能的弹性块存储(EBS)以及传统的关系型数据库服务和NoSQL数据库服务等,并以客户案例为例说明这些服务的实际应用场景。

2015-09-22

基于亚马逊云科技云服务的高可用应用设计 v1.0

云计算在给架构师带来了许多新的设计挑战的时候,也给带来了许多新的设计理念和可用的服务。如何在设计应用的时候充分利用云平台的各种特点是基于云平台设计的一个重要因素。在这个演讲中,我们将以亚马逊AWS云平台为例,讨论如何设计一个高可用应用。我们先会对AWS的服务进行高可用性的分类,并从高可用角度对典型服务进行介绍,然后依次讨论高可用设计的5大常见设计原则,并结合亚马逊云科技的相关服务依次进行架构设计分析。

2014-05-29

亚马逊云科技云服务入门介绍_方国伟

第一讲:亚马逊云科技与服务入门介绍 § 了解亚马逊云科技云计算概览及价值主张 § 了解亚马逊云科技云服务服务的特点:灵活、高效、弹性以及安全性 § 了解亚马逊云科技云服务的基础知识,包括亚马逊云科技的计算、存储、网络、数据库和大数据等服务概况

2014-05-29

方国伟:亚马逊云科技云服务的发展和创新

这部分讲述亚马逊云科技的发展背景和目前进展情况,主要包含三个方面:首先是介绍亚马逊云科技云服务的整体服务情况以及她的最新发展状况;然后以与亚马逊云科技相关的创新为例讲述亚马逊独特的创新文化;最后讲述亚马逊云科技如何针对大型企业的需求而推出的各种企业级服务和支持,从而满足不同类型客户的各种需求。

2014-05-29

亚马逊云科技的互联网存储服务

这是我们在2014年SNW大会上的演讲稿。我们正在进入数字化生存时代,因此如何保存爆炸性增长的数据是一个挑战。在移动互联网时代,我们需要面向互联网的存储。大数据需要像S3这样面向互联网的数据存储方式。S3为用户提供简单易用、安全可靠、海量的存储服务!

2015-09-22

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除