机器学习中的多种技术与应用
1. 循环神经网络(RNN)相关内容
1.1 RNN的应用场景
RNN有多种应用类型,具体如下:
- 序列到序列(Sequence-to-Sequence) :可用于天气预测、机器翻译(使用编码器 - 解码器架构)、视频字幕生成、语音转文本、音乐生成、识别歌曲和弦等。
- 序列到向量(Sequence-to-Vector) :对音乐样本按音乐流派进行分类、分析书籍评论的情感、根据脑植入物读数预测失语症患者所想的单词、根据用户观看历史预测用户观看电影的概率(这是推荐系统协同过滤的一种实现方式)。
- 向量到序列(Vector-to-Sequence) :图像字幕生成、根据当前艺术家的嵌入创建音乐播放列表、根据一组参数生成旋律、在图片中定位行人(如自动驾驶汽车摄像头的视频帧)。
1.2 RNN层的输入输出维度
RNN层的输入必须是三维的,各维度含义如下:
| 维度序号 | 含义 | 示例说明 |
| ---- | ---- | ---- |
| 第一维 | 批次维度,大小为批次大小 | 若处理包含5个时间序列的批次,此维度大小为5 |
| 第二维 | 表示时间,大小为时间步数 | 每个时间序列有10个时间步,此维度大小为10 |
| 第三维 | 每个时间步的输入,大小为每个时间步的输入特征数 | 每个时间步有2个值(如温度和风速),此维度大小为2 |
输出同样是三维的,前两维与输入相同,最后一维等于神经元数量。例如,一
超级会员免费看
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



