36、人类尖叫检测与自动驾驶决策机制研究

人类尖叫检测与自动驾驶决策机制研究

人类尖叫检测模型

在检测遇险音频时,研究人员测试了多种模型。以下是使用基于支持向量机(SVM)分类的不同模型在检测遇险音频时的准确率:
| 模型 | 准确率(%) |
| — | — |
| SVM | 92.143 |
| 逻辑回归 | 53.234 |
| K - NN算法 | 76.333 |

从表格中可知,SVM分类器给出了最佳结果,准确率达到92%,逻辑回归为53%,K - NN模型为76%。研究使用了67%的音频数据集进行训练,33%用于测试,在测试音频中,模型能准确预测92%的音频。

多层感知器模型在处理音频检测时也有不错的表现。该模型的输入大小在训练时就已固定,所有声音会加载到数据框中。由于声音长度不同,数据框会根据最小声音进行调整,以确保所有声音维度相同。该模型共有六层(包括输入层),除输出层外,每层都使用‘ReLU’激活函数,输出层使用‘Sigmoid’激活函数,因为它的值在0到1之间,适合预测事件是否发生。各层的感知器数量分别为:第一层12个,第二层8个,第三层10个,第四层5个,第五层3个,最后一层1个,这种配置能提供最佳的学习率和准确率,当前准确率为89.333%,误检率为5%。

该模型需要三个目录:负目录包含人们正常对话、鸟鸣、汽车声等;正目录包含男性、儿童、女性的尖叫声等;测试目录包含用于评估模型性能的声音。采用交叉熵作为损失函数,因为它适用于二元分类问题。同时使用‘Adam’优化器更新网络权重。

当模型接收到声音时,会尝试利用感知器的权重和偏差识别其中的模式。若未成功,会微调权重以获得正确结果。若成功检测到尖叫,会调用紧急函

评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符  | 博主筛选后可见
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值