自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(30)
  • 收藏
  • 关注

原创 无需重训练即可教语音识别器学习新词

该方法包含多种针对实体列表的偏置技术,可同时作用于模型的编码器(将输入转换为向量表示)和束搜索解码器(评估候选输出序列),通过组合应用最大化准确转录概率。在包含复杂医学术语(如疾病和药品名称)的数据集上,该方法将ASR模型对这些实体的F1分数(综合考量假阴性和假阳性)从无偏置模型的39%提升至62%。同样,在收录欧洲议会录音的公开基准Vox Populi上,该方法将罕见实体(城市名称、人名等)的识别F1分数从49%提升至80%,且无需对基础ASR模型进行任何重训练。

2025-07-29 23:11:38 126

原创 亚马逊AutoML论文获最佳论文奖

论文提出了一种停止超参数优化过程的新准则在首届自动化机器学习(AutoML)会议上,我们团队凭借关于贝叶斯优化终止方法的研究获得最佳论文奖。该研究解决了机器学习中关键的超参数优化(HPO)问题——如何确定停止搜索的最佳时机。

2025-07-29 22:26:39 123

原创 亚马逊机器人如何用多模态识别技术取代条形码

条形码已使用近50年,虽然无处不在且几乎不会出错,但对亚马逊来说还不够完美。在亚马逊运营中心,员工需要在商品流转至送货车的多个节点扫描条形码验证身份,这个过程需要人工定位和扫描,且可能遇到条码损坏或缺失的情况。面对数百万种不同形状尺寸的商品,这种流程难以自动化。目前还没有机器人能灵活处理仓库中所有商品并完成扫描。亚马逊的解决方案是:用多模态识别技术(MMID)增强或取代条形码,彻底摆脱低效的人工识别。

2025-07-29 19:18:54 191

原创 图神经网络的未来与挑战

亚马逊AWS高级首席科学家George Karypis在2022年网络搜索与数据挖掘会议(WSDM)上发表主题演讲,重点探讨了图神经网络(GNN)这一研究领域。他指出:“当前仍存在许多基础理论问题亟待解决”。

2025-07-29 18:11:37 83

原创 机器学习赋能计算机嗅觉革命:Osmo的气味图谱突破

12岁的Alex Wiltschko用零花钱购买了人生第一瓶香水Azzaro pour Homme,由此开启了对气味的终生迷恋。这位现任Osmo CEO的科学家坦言:“我的大脑天生为气味而兴奋”。目前Osmo已获得6000万美元融资,其技术路线展示了机器学习在跨感官领域的革命性潜力。正如Wiltschko所说:“当我们能数字化玫瑰的芬芳时,人类感知世界的维度将被永久扩展。"这就像通过了气味的图灵测试,"Osmo产品总监Jon Hennek表示。该模型甚至比单个人类评估者更接近专家组的平均判断。

2025-07-29 17:27:27 256

原创 亚马逊AI模型评估产品评论中的实用建议有效性

电子商务网站的产品评论是消费者购物决策的重要参考,其中常包含"首次使用相机前充电8小时"等非显而易见的实用建议(product tips)。为帮助消费者免于海量评论的筛选,研究者开发了自动提取技巧的方法,但消费者仍需判断这些建议的可信度。核心是一个能判断两句话支持/反对/中立关系的模型,例如"建议使用前充电"支持充电建议,而"电池已预充电"则构成反对。研究表明,至少50%的提取建议存在支持证据,1/3存在反对证据,验证了该技术的实用价值。更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)

2025-07-29 16:23:23 68

原创 无监督通用异常检测方法SEAD解析

传统基于机器学习的异常检测系统依赖标注数据进行监督训练,但在线场景中数据多样且分布持续变化,标注成本极高。在2025年ICML会议上,我们提出名为SEAD(流式异常检测集成)的解决方案。实验显示,当向集成中添加13个随机评分模型时,SEAD准确率仅下降0.88%,证明其能有效过滤不可靠模型。SEAD基于"异常事件罕见"的洞见,为集成中的基础检测器分配权重时,优先选择异常分数输出较低的模型。(架构图说明:SEAD通过MWU机制动态调整基础检测器权重,橙色曲线显示当某模型开始误报时,其权重被快速降低)

2025-07-29 15:16:22 96

原创 提示工程:大语言模型的新特征工程

亚马逊网络服务AI实验室首席应用科学家Miguel Ballesteros表示,为了使大型语言模型发挥最大效用,它们需要生成连贯一致的输出,并能够识别以不同方式表达的提示。作为今年自然语言处理实证方法会议(EMNLP)语义学领域的高级主席,Ballesteros指出,随着大型语言模型在该领域的重要性日益增长,"提示工程"已成为主要研究课题。"过去我们使用特征工程,你有一个统计模型,添加不同类型的表示或特征,然后需要调整模型及其特征,"Ballesteros说。

2025-07-29 14:09:05 87

原创 Prime Video如何将时间序列异常转化为可操作警报

Prime Video客户必须能够在所有支持该应用的设备(如手机、智能电视或游戏主机)上可靠地流式传输内容。面对海量设备类型和地区组合,Prime Video团队通过重构问题为大规模在线时间序列异常检测任务,开发了自动化监控解决方案。

2025-07-29 12:47:20 132

原创 语音解耦技术推动语音AI的多样性与包容性

在2022年亚马逊re:MARS大会上,AWS高级软件开发经理Ewa Kolczyk与Alexa资深语音科学家Kayoko Yanagisawa展示了题为"通过语音解耦技术推动语音AI的多样性与包容性"的演讲。该技术通过机器学习将语音中的语言、口音、年龄、性别和情感等特征分离,从而生成具有不同特征的Alexa语音响应。目前该技术已应用于Amazon Polly文本转语音服务,未来将扩展至更多语音交互场景。更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)

2025-07-29 11:01:38 226

原创 亚马逊ICML 2023论文技术速览

提出首个支持标签边际分布偏移的基准测试集RLSbench,突破传统域适应假设限制。《高维正则化模型的代表点选择》开发基于影响函数的训练样本归因方法。更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)从超图能量函数推导出新型神经网络架构,解决多元关系建模问题。采用保形分位数回归替代高斯过程,提升贝叶斯优化样本效率。(完整技术细节请参阅原文论文)

2025-07-29 09:06:23 243

原创 亚马逊Q Developer:用自然语言构建机器学习模型

开发基于AI的预测模型通常需要数据科学专业知识、机器学习算法经验以及对业务场景的理解。完整的数据科学应用开发周期(从数据获取到模型训练评估)可能需要数天甚至数周时间。2024年re:Invent大会首次发布测试版,并于2025年2月28日正式推出的Amazon Q Developer in SageMaker Canvas,是一款基于生成式AI的助手,允许客户仅用自然语言在几分钟内构建和部署ML模型,无需ML专业知识。

2025-07-29 08:07:58 99

原创 Astro机器人流畅运动背后的科技原理

通过预测规划、不确定性建模、独特约束轨迹优化和多尺度规划等技术,Astro家用机器人赢得了用户的信任。

2025-07-29 06:06:26 113

原创 AWS上实现超大规模模型训练的近线性扩展

当前最先进的语言模型具有数十亿参数。要在可控时间内训练这些模型,需要将工作负载分配到大型计算集群上。理想情况下,训练时间应随着集群规模扩大而线性减少。但由于节点间协调工作所需的通信会抵消并行化带来的收益,实现线性扩展非常困难。我们近期优化了微软DeepSpeed分布式训练库的通信效率,在最多64个GPU上显著提升了性能。但当规模从数十个GPU扩展到数百个GPU时,在公有云环境中通信开销再次成为效率瓶颈。

2025-07-28 23:11:25 314

原创 量子计算先驱David Schuster的二十年探索之路

2004年,当时还是耶鲁大学博士生的Schuster在《自然》杂志发表开创性论文,首次实现超导电路与微波光子的强耦合,由此创立了"电路量子电动力学"新领域。2007年,他团队在《物理评论A》提出的"transmon"量子比特设计,通过精巧的物理设计将对外部噪声的敏感度降低两个数量级,现已成为行业标准,被亚马逊等科技巨头广泛采用。

2025-07-28 22:26:31 293

原创 亚马逊发布TEACh数据集训练家用机器人

亚马逊科学团队公开发布的TEACh数据集包含来自模拟环境的3000多组对话及关联视觉数据,旨在推动能完成复杂家务任务的AI助手研发。

2025-07-28 21:14:17 137

原创 使用监督学习训练图像聚类模型

传统机器学习模型依赖标注数据进行监督学习,而获取标注数据成本高昂。无监督学习的主要方法是聚类,即根据显著特征将数据点分组。传统聚类算法依赖启发式规则(如聚类中心距离阈值或分布形态)确定边界。在ICCV 2021发表的论文中,我们提出从数据中学习边界划分的方法。当前研究正探索构建通用聚类模型,以实现在人脸、动物物种等不同数据类型间的迁移聚类能力。更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)

2025-07-28 20:06:33 150

原创 亚马逊机器人如何应对交通拥堵

"这是机器人研究的最佳试验场,"Wolf表示,"我们的解决方案已部署在数十万台机器人上,而运营的持续演进总带来新挑战。"通过机器学习策略共享和前瞻性规划,亚马逊计划进一步增加机器人数量同时提升流通效率。典型履约中心有四层,每层面积相当于数个足球场,4000多台机器人穿梭其间,将货架运送到工作站。"起初增加机器人能提升效率,但达到某个临界点后,它们开始相互干扰。在分拣中心,1000多台机器人将包裹运送到数百个代表不同邮编区域的滑槽。更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)

2025-07-28 19:16:21 266

原创 基于Amazon Translate的深度学习教材自动翻译系统

动手学深度学习》(D2L.ai)是一本开源的深度学习教材,通过交互式Jupyter笔记本提供PyTorch/JAX/TensorFlow/MXNet自包含代码。该书已被全球400多所大学采用,包括剑桥大学、斯坦福大学等顶尖院校。

2025-07-28 18:06:28 264

原创 基于vLLM与AWS Trainium的冷启动推荐优化

推荐系统中的冷启动不仅涉及新用户或新物品问题,更核心的是系统初始化阶段完全缺乏个性化信号。当新用户首次访问或新内容上线时,由于缺乏行为历史数据,系统只能提供泛化推荐,导致点击率和转化率下降。传统解决方案(协同过滤、矩阵分解或热门列表)难以弥合信号缺口。

2025-07-28 17:26:38 241

原创 利用Amazon Bedrock生成AI增强设备维护建议

在制造业中,服务报告中的宝贵见解往往未被充分利用。本文探讨AWS客户如何构建自动化解决方案:通过生成式AI实现海量报告的数字化处理与关键信息提取。该方案采用Amazon Nova Pro(基于Amazon Bedrock)和Amazon Bedrock知识库,根据设备状态生成与专家建议库相匹配的维护方案。随着使用过程,知识库将持续扩展。

2025-07-28 16:23:29 252

原创 使用Amazon Q和MCP优化深度学习环境

AWS DLC为生成式AI从业者提供优化的Docker环境,支持在Amazon EC2、EKS和ECS上训练和部署大语言模型(LLM)。预装CUDA库、主流ML框架和EFA插件自动配置稳定环境,解决版本兼容性问题作为Docker镜像提供PyTorch和TensorFlow支持持续更新框架和驱动程序,免费使用。

2025-07-28 15:16:33 721

原创 AI如何重塑芯片设计未来

摩尔定律正走向终结。工程师们转向人工智能等新技术来突破芯片设计极限——三星将AI植入存储芯片实现存内计算,谷歌TPU V4芯片性能较前代提升两倍。"这不是取代人类,而是释放工程师处理更复杂任务的能力。行业需要既懂AI又理解半导体物理的复合型人才。更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)

2025-07-28 14:09:38 96

原创 联邦学习中的持续学习技术

联邦学习使分布式设备能够利用本地数据贡献全局模型,同时保护数据隐私;两者的结合面临关键挑战——如何避免"灾难性遗忘",即新数据训练导致模型遗忘旧知识。将NP难的整数规划问题松弛为分数系数优化,通过迭代计算实现高效求解。协调式方法通过梯度聚合保护数据隐私,仅需1-4次迭代即可收敛。图示:协调式方法通过服务器聚合各设备梯度信息,计算全局最优样本保留策略。该方法为不同存储容量的边缘设备提供了自适应解决方案,相关代码已开源。更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)

2025-07-28 12:47:39 178

原创 2025年最佳网络监控工具Top8

本评测基于产品文档分析及真实用户反馈,重点考察监控维度、模板丰富度、自动化能力等12项技术指标,2025年7月由Luis Millares完成最终更新。开源工具(如Cacti)适合技术团队自主维护,商业方案(如Datadog)提供更稳定的企业级支持,但年费可能超过$20,000。更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)✔️ Flowmon网络性能诊断。

2025-07-28 11:01:38 382

原创 无监督通用异常检测方法SEAD解析

在当今工业和在线应用中,实时数据流中的异常检测至关重要。传统监督学习方法面临标注成本高、数据分布动态变化的挑战。亚马逊科学团队在ICML 2025提出的SEAD框架创新性地解决了这些问题。该方法为电商风控、工业设备监控等实时流数据处理场景提供了新的技术解决方案。更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)

2025-07-28 09:10:32 358

原创 使用Amazon Bedrock和Amazon Transcribe构建AI驱动的自动化会议摘要系统

摘要组件由Amazon Bedrock提供支持,它提供了访问最先进的基础模型的能力。prompt = f"""即使这是一个原始的会议讨论记录,缺乏清晰的结构和上下文,包含多个发言者、不完整的句子和离题的内容,请尽可能详细地提供清晰全面的对话分析。不要遗漏任何信息。尽可能多地捕捉信息。在摘要中使用项目符号而不是破折号。重要提示:对于所有部分标题,请使用纯文本,不要使用markdown格式(不要使用#、##、**或*符号)。每个部分标题应全部大写,后跟冒号。

2025-07-27 23:11:55 808

原创 低精度算术提升机器人定位效率 - 亚马逊科学团队技术创新

低精度浮点算术(减少小数点位数的比特表示)是深度学习领域的常用技术,将比特数从标准32位减半至16位可提升一倍效率且几乎不影响精度。同步定位与建图(SLAM)是自主移动机器人的核心技术,需同时构建环境地图并确定机器人位置。由于SLAM计算密集,在资源受限的消费级机器人上部署时需采用计算优化技术。基于滑动窗口的捆集调整(BA)是视觉里程计的核心,传统方法存在线性化误差。位姿图优化(PGO)处理全局轨迹修正时,问题规模可从数百个位姿增长至数千个。更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)

2025-07-27 22:26:31 124

原创 英国拟立法限制iOS与Android垄断地位,强制开放移动生态

英国拟通过《数字市场、竞争与消费者法案》(DMCCA)对科技巨头实施严格监管。更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)

2025-07-27 21:53:26 195

原创 用户可控的统一风格迁移框架 - 亚马逊科学研究院

现有的风格迁移方法中有二进制分配矩阵的方法,也有高熵矩阵的方法,我们的方法可以近似这两种方法。我们发现,根据标准指标,我们的方法在保留内容输入的内容和风格输入的风格方面做得更好,并且产生了更多样化的输出。我们还进行了一项有10名人类评估者参与的研究,发现在特定的多样性参数设置下,受试者更喜欢我们的方法生成的图像,而不是其他方法生成的图像。我们证明,在给定用户指定的输入参数设置下,一种称为Sinkhorn-Knopp的算法可以高效计算相关的分配矩阵,从而从同一风格迁移模型中产生多样化的输出。

2025-07-27 19:13:13 624

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除