27、在一个特定的循环神经网络(RNN)示例中,网络有105个可训练参数。已知输入为3个长度为7的向量,RNN层有3个节点,每个节点输出7维。为什么在这种情况下会有105个参数呢?
RNN节点的输入由输入向量、隐藏状态和偏置项组成,且这些输入与生成的输出完全连接。参数数量计算与输入维度、隐藏状态维度、节点数量等有关。
可按全连接层参数计算方式:输入维度与输出维度乘积加上偏置项数量。
- 这里输入维度为7,输出维度为7,每个节点有7个偏置项,3个节点参数为:
$$
(7 \times 7 + 7) \times 3 = 105 \text{个}
$$
28、Tokenization MidiTok欢迎为其软件包做出贡献,它定义了以下开放问题:a. 节拍记号表示法;b. 允许在节拍和秒时间单位之间切换。选择其中一个可能的改进(或你自己设计的一个),并提出、实现和演示一种标记化方法。
任务说明
可选择一个问题,如时间签名表示,研究现有音乐数据中时间签名的表示方式,设计新的标记化方案,使用Python等编程语言实现该方案,并通过示例音乐数据演示方案的有效性。
29、音乐分类或聚类。你能否创建一个模型,将音乐数据(音频、MIDI 或其他形式)准确分类到你期望的分组中?或者,你可以以无监督的方式将其作为聚类问题来处理。如果你试图按一位作曲家对作品进行分组,你会提取哪些音频特征来辅助识别?是否有可能学习到能捕捉潜在相似性的聚类?
聚类
在聚类方面,模型有可能学习到捕捉潜在相似性的能力,但若按照作曲家进行聚类可能较困难。例如,贝多芬的交响曲在某些特征上可能比其弦乐四重奏更接近莫扎特的交响曲。
目前有多种用于聚类音乐数据的技术,常见的方法包括:
- 自组织映射(SOM)
- k-均值
- 高斯混合模型(GMM)
- 各种矢量量化(VQ)技术

最低0.47元/天 解锁文章
999

被折叠的 条评论
为什么被折叠?



