语音计算与AI技术的工程科学融合

语音计算的发展历程

与计算机进行语音交互对许多人来说是相对新颖的体验,但这对于某中心的高级首席工程师Luu Tran来说早已司空见惯。作为语音计算的早期采用者,Tran回忆道:“我记得拿到第一块声卡时,它配备了麦克风和名为Dragon Naturally Speaking的软件。”通过简单的即插即用工程,他就能在1990年代的PC上使用语音打开和保存文件。

如今,我们正处于语音计算的黄金时代,这得益于机器学习、人工智能和语音助手技术的进步。“某中心对Alexa的愿景始终是成为一个会话式、自然的个人助手,能够了解用户、理解用户并具有一定个性。”

工程与科学的协同创新

在目前的工作中,Tran正通过促进工程师与科学家之间的合作来推动机器学习与人工智能的发展。他每天鼓励工程师和科学家并肩工作,将最新科学研究与尖端工程相结合。

“将工程与科学结合起来是非常强大的组合。我们的许多项目并非简单的确定性工程问题,仅靠更多代码和更好算法就能解决,”他表示,“我们必须运用多种技术并利用科学来填补空白,比如机器学习建模和训练。”

食谱推荐引擎的技术实现

近期受益于这种敏捷协作方式的项目是Alexa的新食谱推荐引擎。要为用户提供相关的食谱推荐,Alexa必须从其庞大集合中选择单个食谱,同时理解用户的需求和上下文。

构建新食谱引擎需要两个并行项目:训练新的机器学习模型以从数百万在线食谱中筛选食谱,以及构建新的推理引擎以确保每个请求都附带去标识化的个人和上下文数据。

科学家团队主要专注于机器学习模型,研究所有现有的公开ML方法,最终确定了六种可能适用的模型。与此同时,工程师团队着手设计和构建新的推理引擎,以更好地捕获和分析用户信号,包括隐式(如时间)和显式(用户要求的是晚餐还是午餐食谱)信号。

推理引擎必须能够处理现有用户和新用户的查询。性能和隐私是关键要求,工程团队必须设计并部署引擎以优化吞吐量,同时最小化计算和存储成本,并遵守客户删除个人信息的请求。

持续优化与未来展望

在新的推理引擎准备就绪后,工程师将其与科学家构建和训练的六个ML模型集成,连接到设计团队构建的新前端界面,并测试比较各个模型的结果。所有六个模型都比基线推荐有所改进,但有一个模型的转化率比其他模型高出100%以上,该模型目前已在生产环境中运行。

项目并未就此结束,现在进入持续改进阶段。“我们不断从用户行为中学习:用户对哪些食谱真正满意?他们从不选择哪些食谱?”

为了进一步加速Alexa创新,某中心成立了Alexa首席社区——一个由数百名工程师和科学家组成的矩阵团队,致力于Alexa及相关技术的工作。“我们有来自公司各个部门的人员,无论他们的汇报关系如何。将我们凝聚在一起的是共同致力于Alexa背后的技术,这非常棒。”

如今,与科学家密切合作让工程团队能够更好地理解最先进AI的能力范围,从而在系统设计中充分利用这些能力,同时也能理解其局限性,避免在不可行的时间框架内构建不切实际的解决方案。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
对网络安全、黑客技术感兴趣的朋友可以关注我的安全公众号(网络安全技术点滴分享)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值