深度学习Pytorch版---第一章

本文探讨了日常生活中的机器学习应用,如手机语音识别,以及其背后的唤醒词模型设计。文章重点介绍了机器学习的关键组件,包括数据、模型、目标函数和优化算法,特别是监督学习和分类问题的实例。通过训练和优化参数,以适应多样化唤醒词,强调了数据质量和模型族的重要性。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.1日常生活中的机器学习


手机的语言识别系统--->语言转换文字--->自启动地图应用程序--->地图筛选路径。

编写程序响应唤醒词:::

麦克风每秒收集4.4万个样本(声波振幅的测量值)--->编写程序,确定麦克风采集到的原始音频片段,输出{ 是/否包含唤醒词 }的可靠预测。

人--->麦克风--->唤醒词模型--->{是,否}

采集音频样本的数据集--->对包含和不包含唤醒词的数据进行标注。

不需要设计一个明确地识别唤醒词的系统???

设计一个灵活的程序算法--->输出由许多参数决定--->使用数据集来确定最佳参数集--->通过某种方式度量性能。

参数:可以看出一个旋钮,旋钮的转动可以调整程序的行为。

模型:任一调整参数后的程序

模型族:通过操作参数而生成的所有不同程序的集合

在学习机器学习算法之前,必须精确的定义问题,确定输入和输出的性质。

对于上述问题。模型接收一段音频作为输入--->然后生成一个是/否作为输出。如果一切正常,经过训练,模型可以对片段是否含有关键词的预测都是正确的。

现在模型,对Alexa这个词总是能够发出“是”,但是唤醒词是多种多样的,我们需要一个足够丰富的模型族,使模型多元化。模型族中的另一个模型,在听到Hey Siri,也可以发出“是”。

直觉上,他们是相似的任务,模型族应该适用于这两种处理。

但是对于完全不同的输入输出,可能需要不同的模型族。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值