自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(5)
  • 收藏
  • 关注

原创 MUSICMAMBA: A DUAL-FEATURE MODELING APPROACH FOR GENERATING CHINESE TRADITIONAL MUSIC WITH MODAL PRE

每个子列表中的数字是音符之间的音程关系(通常以半音或者调式音程表示),可以理解为相邻音符之间的音程步骤。这个模式的音程关系是:全音、全音、三全音、全音。它可能代表某个具体的调式或旋律段落中的音程结构。这种音程关系表示:全音、三全音、全音、三全音。它可能是一种不同的音阶或旋律模式。

2024-12-16 21:28:57 495 1

原创 论文SIX DRAGONS FLY AGAIN

Jeonggan的边界由**“|”符号表示,表示小节的开始或结束;音符的位置由0到15之间的数字表示,并紧接着音高符号。装饰音(sigimsae)可带有时值或不带时值:有时值的装饰音(如图4中的‘ㄱ’符号)与音高符号的处理方式相同;该音乐仅存一条基本旋律,并使用了罕见的8拍节奏,难以直接应用于现代演奏实践。为了解决这一问题,该项目采用了一种基于自监督的 BERT-like 掩码语言模型,通过对 OCR 识别的正干谱数据集进行训练,自动填充适当的节奏与音符,使古代旋律适应现代表演需求。

2024-12-13 19:50:07 194

原创 SYMBOLIC MUSIC GENERATION WITH DIFFUSION MODELS

这种方法结合了变分自编码器的强大表示能力和扩散模型的生成能力,能够有效地对音乐进行编码、生成和变换。

2024-12-09 05:00:56 861

原创 FFN公式实现

其中,W1,b1W_1, b_1W1​,b1​ 和 W2,b2W_2, b_2W2​,b2​ 分别为第一层和第二层的权重与偏置。该网络会对输入的每个位置独立地进行处理(点式运算),通常将维度从 dmodeld_{model}dmodel​ 升高到较大维度 dffd_{ff}dff​(如 2048),再映射回 dmodeld_{model}dmodel​ ,通过这种扩张和压缩实现非线性特征提取。FFN(Feed Forward Network)实现方式的解释和一个简单的代码示例(以 PyTorch 为例)。

2024-12-09 00:19:41 478

原创 Pop Music Transformer: Beat-based Modeling and Generation of Expressive Pop Piano Compositions论文笔记

在一个小节内,"Position" 的顺序是固定的,`Position (9/Q)` 永远不会出现在 `Position (3/Q)` 之前,除非中间有一个新的 "Bar"。当模型学习音乐生成时,"Bar" 和 "Position" 提供了明确的时间和结构线索,使得模型能够理解音乐的时间和节奏结构。在音乐生成模型中,"Bar" 和 "Position" 的概念帮助模型更好地理解和生成有结构的音乐。下面是一个简单的示例,展示模型在训练过程中如何理解 "Bar" 和 "Position" 的概念。

2024-07-06 14:16:38 1772 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除