
笔记
文章平均质量分 80
孤独的追光者
不断追梦的普通人
展开
-
Conv1d与Conv2d对应的底层公式及shape计算方法
Conv1d与Conv2d对应的底层公式及shape计算方法原创 2024-06-12 17:47:03 · 767 阅读 · 0 评论 -
音源分离 | Spleeter: a fast and efficient music source separationtool with pre-trained models
Spleeter 是一个用于音乐源分离的快速高效工具,它使用预训练模型U-Net。原创 2024-05-15 09:47:06 · 799 阅读 · 0 评论 -
音源分离 | Hybrid Spectrogram and Waveform Source Separation
本文提出了基于Demucs架构的的时域+频域的分离模型原创 2024-05-14 17:22:04 · 815 阅读 · 0 评论 -
音源分离|Music Source Separation in the Waveform Domain
本文提出了一种新的时域模型Demucs,它具有U-Net结构和双向LSTM原创 2024-05-14 13:29:42 · 1068 阅读 · 1 评论 -
音源分离|数据集|MUSDB18-HQ
音源分离数据集:MUSDB18-HQ介绍。原创 2024-05-07 09:47:38 · 974 阅读 · 1 评论 -
音源分离|MUSIC SOURCE SEPARATION BASED ON A LIGHTWEIGHT DEEP LEARNING FRAMEWORK
本文中,介绍了一种新的轻量级架构DTTNet,它基于双路径模块和时频卷积时间分布全连接UNet(TFC-TDF UNet)原创 2024-04-25 17:36:47 · 1837 阅读 · 1 评论 -
歌声分离|技术发展史
歌声分离(vocal/Singing Voice Separation)是指将歌声与背景伴奏分离的技术。在旋律提取、歌手识别、哼唱/歌唱检测、卡拉OK伴奏、歌词识别、歌唱语种识别等应用领域有十分重要的作用。由于歌声与由多种音调类乐器组成的伴奏都是和声(不能视为噪声),并按照和声结构耦合在一起(即基频或泛音重叠),而且还有多种打击乐器的干扰,因此歌声分离具有相当大的难度和挑战性。原创 2024-04-25 11:42:11 · 937 阅读 · 0 评论 -
音源分离 | HYBRID TRANSFORMERS FOR MUSIC SOURCE SEPARATION
在音乐源分离(MSS)中出现的一个自然问题是,远程上下文信息是否有用,或者局部声学特征是否足够。本文提出了Hybrid Transformer Demucs (HT Demucs),一种基于hybrid Demucs[1]的混合时/频 bi-U-Net。原创 2024-04-22 11:30:59 · 1089 阅读 · 3 评论 -
语音分离 | SPMAMBA: STATE-SPACE MODEL IS ALL YOU NEED IN SPEECH SEPARATION
基于cnn的方法对长序列音频的建模能力有限,导致分离性能不理想。而基于Transformer的方法由于计算复杂度高,在实际应用中也受到限制。值得注意的是,在计算机视觉中,基于Mamba的方法以其强大的性能和减少的计算需求而闻名。本文,提出了一种使用状态空间模型的语音分离网络架构,称之为SPMamba。原创 2024-04-17 13:43:56 · 843 阅读 · 0 评论 -
pytorch快速搭建神经网络模型
pytorch搭建神经网络转载 2022-01-24 19:48:33 · 318 阅读 · 0 评论 -
面相过程与面相对象
面相对象与面相过程结构化技术的特点:把现实世界描绘为数据在信息系统中的流动,在数据流动过程中数据发生转化。通过自顶向下的程序设计将复杂的程序分解为程序模块的层次图。概括为自顶向下、逐步求精、模块化设计、结构化编码的基本特点。面向对象的特点:面向对象技术将数据模型和处理模型二者合一,将属性和方法封装在一个对象当中。将信息系统看成是一起工作来完成某项任务的相互作用的对象集合;通过定义系统中所有对象类型并显示对象之间是如何通过相互作用来完成分析任务。面向对象就是既使用对象又使用类和继承等机制,而且对象之间仅能通原创 2020-05-18 17:25:08 · 1140 阅读 · 0 评论