广度深度都要,亚马逊是如何推动 Alexa 内生成长的?

亚马逊的Alexa通过深度学习和迁移学习技术,实现了错误率降低25%,并学会了上下文语义转移,使得用户与其交流更加自然流畅。同时,Alexa掌握了超过7万个技能,包括测验、游戏和冥想等,其技能数量在过去两年增长了六倍。然而,Alexa的潜力远未完全开发,大多数用户仅将其用于基础功能。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

640?来源:雷锋网

摘要:发展到今天,Alexa 已经成为亚马逊旗下最重要的几个业务支柱之一,尤其是在人工智能语音助手层面,它和 Google Assistant、Apple Siri、Microsoft Cortana 并驾齐驱,甚至在应用场景上有领先之势。


说实话,2014 年秋天亚马逊推出 Echo 音箱时,大多数人根本不明白 Bezos 葫芦里到底卖的什么药,随后的几年里 Echo 和一大群 Alexa 设备却攻城略地,成了人见人爱的好伙伴。


虽然 Alexa 已经几乎“附身”了所有设备,但今年亚马逊在语音助手领域真正的进步却从广度转到了深度上。


当然,也不是说 Alexa 的增长遇到了瓶颈。今年其销售市场数量成功翻番,学习法语和西班牙语也提上了日程。同时,能与 Alexa 互动的智能家居设备已经超过 2.8 万款,是今年年初的 6 倍,与 Alexa 深度绑定的产品也突破 100 种。


总的来说,真正定义 2018 年的其实是 Alexa 的秘密进化,以及这种进化方式对其潜力释放的推动。Alexa 正变得越来越聪明,但这种润物细无声的微妙进化许多人恐怕根本注意不到。


我们试图一探究竟。


“铁脑袋”


由于许多语音助手的改良目标是减少矛盾,因此它们都用上了看不见的设计。在过去的一年里,Alexa 已经学会了将上下文语义从一个问题转移到另一个问题。同时,用户再也不用每问一次问题就喊“暗号”唤醒 Alexa 一次了,而且只需一个命令,你就能要求 Alexa 做多个任务。此外,召唤 Alexa 的技能时,你也无需一字不差的说出它的名字了。


是不是听起来只是些雕虫小技?你太小看 Alexa 了,这些看似玩票的小升级是在引导 Alexa 成为一个更善于“唠嗑”的语音助手,这才是解决问题而非创造新矛盾的真正方案。可以这么说,现在你跟 Alexa 聊天可比一年前顺畅多了。


随着机器学习技术的不断提升与改进,这些升级并不令人吃惊。为了减少 Alexa 的错误率,亚马逊还用了所谓的主动式学习,系统能自动识别自己需要人类专家帮助的领域并进行针对性提升。


“这样的解决方案被输送到了我们每一条‘血管’,包括语音识别和自然语言理解。”亚马逊 Alexa 首席科学家兼副主席 Rohit Prasad 说道。“它让我们所有的机器学习模型都上了一个台阶。”


最近,亚马逊还为 Alexa 引入了迁移学习技术。这就意味着每个人都能借助亚马逊的“蓝图”技巧打造自己的食谱。开发者更是能利用 Alexa 了解的所有餐馆或杂货铺知识减少那些乏味的工作。“实质上,有了深度学习我们就能模拟各种领域并将学到的知识转移到新的领域或技巧上。”Prasad 解释道。


机器学习带来的益处让 Alexa 完成了全方位升级,但它对整个系统最为深远的影响还是一年内降低 25% 的错误率。对 Echo 用户来说,这曾经是他们最头疼的问题,未来终于无需再面对了。


未来,Alexa 的进步也不会停滞。本月,Alexa 就推出了自主学习功能,让系统能根据上下文线索自动完成修正。Prasad 就表示:“对 AI 系统来说这可是件大事,毕竟它是从隐含反馈中学习的。”


不过,想突破下一个结界就没那么容易了,因为亚马逊想要 Alexa 在任何时候预测你的需求。同时,Alexa 不但要理解你在说什么,还要读懂你是怎么说的。


“当两个人谈话时,他们能很轻松的理解对方散发出的情感因子,不过机器人可不行。”卡耐基梅隆大学语音识别专家 Alex Rudnicky 解释道。“因此,研发人员试图让 Alexa 变得更复杂,提升其推断对话走向的能力。”


今年秋季,亚马逊就用一份专利抢了个头条,这项技术让 Alexa 能识别用户情绪并作出相应的反馈。不过,帮亚马逊抢了头条的并非这项技术有多先进,而是它随时监听的方式让人感觉不自在,而那种推断你感觉如何的方法会戏剧性地加剧用户的不适。


Prasad 表示,Alexa 的终极目标是拥有远程会话能力,它甚至可能会根据你的提问方式对给定的问题做出不同的反应。不过,想要拥有一个真正理解你语调微妙之处的语音助理,恐怕还需要一段时间。


“如果你了解人的五大情绪。”Rudnicky 说道。“就会发现人类最擅长感知其他人的愤怒。”


技能包


随着 Alexa 设备的爆发性增长,它掌握的技能也在迅速增殖。亚马逊的官方数据显示,Alexa 已经拥有越 7 万个技能,无论测验、游戏还是冥想,它都能驾轻就熟。在两年前,这个数字只有现在的七分之一。


Alexa 虽然已经能预测人们想使用哪项技能,但预测和发现并不能相提并论。同时,用户并没有彻底开发 Alexa 的潜力,大多数人只是将它当作厨房计时器而已。这样一来,开发者也没有动力继续在 Alexa 平台投入了。


此外,Alexa 的兴旺发达也不能仅靠深度学习。虽然借助它 Alexa 能迅速展现出最相关的技能,但语音助手的潜力可不止那些直接的功能需求。2016 年的互动游戏 The Magic Door 就是最好的例子,如果大家用 Echo 只是听听 NPR 或查查天气,那么算法将如何提醒你它自己的存在呢?


“如果我们向用户推介新技能和新功能,绝对能给他们带来引人入胜的体验。”主管 Alexa 体验的 Toni Reid 说道。“不过你得有个度,因为 Alexa 也会超载。我们必须在对的时间做对的事,内容的体量也需要严格控制。”


除了不断为 Alexa 大厦添砖加瓦,亚马逊还得时刻防着谷歌,后者虽然起步稍晚但正在努力缩小与亚马逊之间的差距。市场研究公司 Canalys Research 预计,今年第三季度 Echo 智能音箱出货量达 630 万台,而谷歌则已经将 Google Home 的单季出货量拉到了 590 万台。


不过,这场竞争并没有销售数字看起来那么紧张,因为它不包含第三方设备,在这一领域亚马逊是绝对统治者。而且别忘了,过去四年里亚马逊可以积累了海量的忠实客户。不过,谷歌也有让亚马逊不敢忽略的优势。


“谷歌的 AI 经验相当丰富,而亚马逊则一切都要重头来过。”Canalys 分析师 Vincent Thielke 说道。“由于谷歌的 AI 已经非常先进,因此它们追赶起来毫不费力。”除此之外,Android、Android Auto 和 WearOS 也能成为 Google Assistant 的自留地。反观亚马逊,由于 Fire Phone 已经彻底失败,因此在移动端亚马逊已经没有什么重量级棋子。在与车辆中控信息娱乐系统的整合方面,亚马逊也不是谷歌和苹果的对手,虽然它们已经推出了 Echo Auto 这样的“改装件”。


好在,Alexa 并没有放慢脚步的意思,新增的功能正让它变得包罗万象。至于未来 Alexa 将走向何方,恐怕现在你也能猜出一二了。


未来智能实验室是人工智能学家与科学院相关机构联合成立的人工智能,互联网和脑科学交叉研究机构。


未来智能实验室的主要工作包括:建立AI智能系统智商评测体系,开展世界人工智能智商评测;开展互联网(城市)云脑研究计划,构建互联网(城市)云脑技术和企业图谱,为提升企业,行业与城市的智能水平服务。


  如果您对实验室的研究感兴趣,欢迎加入未来智能实验室线上平台。扫描以下二维码或点击本文左下角“阅读原文”


640?wx_fmt=jpeg

内容概要:本文围绕直流微电网中带有恒功率负载(CPL)的DC/DC升压转换器的稳定控制问题展开研究,提出了一种复合预设性能控制策略。首先,通过精确反馈线性化技术将非线性不确定的DC转换器系统转化为Brunovsky标准型,然后利用非线性扰动观测器评估负载功率的动态变化和输出电压的调节精度。基于反步设计方法,设计了具有预设性能的复合非线性控制器,确保输出电压跟踪误差始终在预定义误差范围内。文章还对比了多种DC/DC转换器控制技术如脉冲调整技术、反馈线性化、滑模控制(SMC)、主动阻尼法和基于无源性的控制,并分析了它们的优缺点。最后,通过数值仿真验证了所提控制器的有效性和优越性。 适合人群:从事电力电子、自动控制领域研究的学者和工程师,以及对先进控制算法感兴趣的研究生及以上学历人员。 使用场景及目标:①适用于需要精确控制输出电压并处理恒功率负载的应用场景;②旨在实现快速稳定的电压跟踪,同时保证系统的鲁棒性和抗干扰能力;③为DC微电网中的功率转换系统提供兼顾瞬态性能和稳态精度的解决方案。 其他说明:文中不仅提供了详细的理论推导和算法实现,还通过Python代码演示了控制策略的具体实现过程,便于读者理解和实践。此外,文章还讨论了不同控制方法的特点和适用范围,为实际工程项目提供了有价值的参考。
内容概要:该论文介绍了一种名为偏振敏感强度衍射断层扫描(PS-IDT)的新型无参考三维偏振敏感计算成像技术。PS-IDT通过多角度圆偏振光照射样品,利用矢量多层光束传播模型(MSBP)和梯度下降算法迭代重建样品的三维各向异性分布。该技术无需干涉参考光或机械扫描,能够处理多重散射样品,并通过强度测量实现3D成像。文中展示了对马铃薯淀粉颗粒和缓步类动物等样品的成功成像实验,并提供了Python代码实现,包括系统初始化、前向传播、多层传播、重建算法以及数字体模验证等模块。 适用人群:具备一定光学成像和编程基础的研究人员,尤其是从事生物医学成像、材料科学成像领域的科研工作者。 使用场景及目标:①研究复杂散射样品(如生物组织、复合材料)的三维各向异性结构;②开发新型偏振敏感成像系统,提高成像分辨率和对比度;③验证和优化计算成像算法,应用于实际样品的高精度成像。 其他说明:PS-IDT技术相比传统偏振成像方法具有明显优势,如无需干涉装置、无需机械扫描、可处理多重散射等。然而,该技术也面临计算复杂度高、需要多角度数据采集等挑战。文中还提出了改进方向,如采用更高数值孔径(NA)物镜、引入深度学习超分辨率技术等,以进一步提升成像质量和效率。此外,文中提供的Python代码框架为研究人员提供了实用的工具,便于理解和应用该技术。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值