- 博客(5)
- 收藏
- 关注
原创 MUSICMAMBA: A DUAL-FEATURE MODELING APPROACH FOR GENERATING CHINESE TRADITIONAL MUSIC WITH MODAL PRE
每个子列表中的数字是音符之间的音程关系(通常以半音或者调式音程表示),可以理解为相邻音符之间的音程步骤。这个模式的音程关系是:全音、全音、三全音、全音。它可能代表某个具体的调式或旋律段落中的音程结构。这种音程关系表示:全音、三全音、全音、三全音。它可能是一种不同的音阶或旋律模式。
2024-12-16 21:28:57
495
1
原创 论文SIX DRAGONS FLY AGAIN
Jeonggan的边界由**“|”符号表示,表示小节的开始或结束;音符的位置由0到15之间的数字表示,并紧接着音高符号。装饰音(sigimsae)可带有时值或不带时值:有时值的装饰音(如图4中的‘ㄱ’符号)与音高符号的处理方式相同;该音乐仅存一条基本旋律,并使用了罕见的8拍节奏,难以直接应用于现代演奏实践。为了解决这一问题,该项目采用了一种基于自监督的 BERT-like 掩码语言模型,通过对 OCR 识别的正干谱数据集进行训练,自动填充适当的节奏与音符,使古代旋律适应现代表演需求。
2024-12-13 19:50:07
194
原创 SYMBOLIC MUSIC GENERATION WITH DIFFUSION MODELS
这种方法结合了变分自编码器的强大表示能力和扩散模型的生成能力,能够有效地对音乐进行编码、生成和变换。
2024-12-09 05:00:56
861
原创 FFN公式实现
其中,W1,b1W_1, b_1W1,b1 和 W2,b2W_2, b_2W2,b2 分别为第一层和第二层的权重与偏置。该网络会对输入的每个位置独立地进行处理(点式运算),通常将维度从 dmodeld_{model}dmodel 升高到较大维度 dffd_{ff}dff(如 2048),再映射回 dmodeld_{model}dmodel ,通过这种扩张和压缩实现非线性特征提取。FFN(Feed Forward Network)实现方式的解释和一个简单的代码示例(以 PyTorch 为例)。
2024-12-09 00:19:41
478
原创 Pop Music Transformer: Beat-based Modeling and Generation of Expressive Pop Piano Compositions论文笔记
在一个小节内,"Position" 的顺序是固定的,`Position (9/Q)` 永远不会出现在 `Position (3/Q)` 之前,除非中间有一个新的 "Bar"。当模型学习音乐生成时,"Bar" 和 "Position" 提供了明确的时间和结构线索,使得模型能够理解音乐的时间和节奏结构。在音乐生成模型中,"Bar" 和 "Position" 的概念帮助模型更好地理解和生成有结构的音乐。下面是一个简单的示例,展示模型在训练过程中如何理解 "Bar" 和 "Position" 的概念。
2024-07-06 14:16:38
1772
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅