- 博客(65)
- 资源 (11)
- 收藏
- 关注
原创 立体声上混|STEREO SIGNAL SEPARATION AND UPMIXING BY MID-SIDE DECOMPOSITION INTHE FREQUENCY-DOMAIN
一种从典型信号模型推导出的用于估计立体声信号中可感知方位角方向的算法。
2025-04-21 20:30:00
694
原创 Hexagon IDE|‘reg‘ 不是内部或外部命令,也不是可运行的程序
Hexagon IDE|'reg' 不是内部或外部命令,也不是可运行的程序。
2024-09-29 13:24:16
265
原创 代码解读 | Hybrid Transformers for Music Source Separation[07]
从模块上划分,Hybrid Transformer Demucs 共包含 (STFT模块、时域编码模块、频域编码模块、Cross-Domain Transformer Encoder模块、时域解码模块、频域解码模块、ISTFT模块)7个模块。 本篇目标:拆解Cross-Domain Transformer Encoder模块。
2024-06-17 22:54:27
1591
原创 代码解读 | Hybrid Transformers for Music Source Separation[06]
从模块上划分,Hybrid Transformer Demucs 共包含 (STFT模块、时域编码模块、频域编码模块、Cross-Domain Transformer Encoder模块、时域解码模块、频域解码模块、ISTFT模块)7个模块。 本篇目标:拆解频域解码模块、ISTFT模块的底层。
2024-06-14 18:00:00
1467
原创 ConvTranspose1d和ConvTranspose2d对应的shape计算方法
ConvTranspose1d和ConvTranspose2d对应的shape计算方法
2024-06-14 17:45:00
615
原创 代码解读 | Hybrid Transformers for Music Source Separation[05]
从模块上划分,Hybrid Transformer Demucs 共包含 (STFT模块、时域编码模块、频域编码模块、Cross-Domain Transformer Encoder模块、时域解码模块、频域解码模块、ISTFT模块)7个模块。本篇目标:拆解频域编码模块的底层。
2024-06-13 17:36:58
726
原创 代码解读 | Hybrid Transformers for Music Source Separation[04]
从模块上划分,Hybrid Transformer Demucs 共包含 (STFT模块、时域编码模块、频域编码模块、Cross-Domain Transformer Encoder模块、时域解码模块、频域解码模块、ISTFT模块)7个模块。 本篇目标:拆解STFT模块的底层。
2024-06-11 17:43:59
896
原创 代码解读 | Hybrid Transformers for Music Source Separation[03]
接着上一篇代码解读 | Hybrid Transformers for Music Source Separation[02]文章,继续对Hybrid Transformer Demucs 代码进行解读。解读目标:明确数据从进入算法,在算法内部,以及在算法输出 这三个阶段中 数据的大小是如何变换的。例如:算法输入数据大小为[BatchSize,Channels,Length],算法内部的数据大小为[BatchSize,Channels,Freqency,Time],巴拉巴拉~
2024-06-07 17:45:00
857
2
原创 代码解读 | Hybrid Transformers for Music Source Separation[02]
对Hybrid Transformer Demucs代码进行解读,目标:对算法原理图中各个模块对应的代码进行解读(时域编码、频域编码、时域解码、频域解码、Cross-Domain Transformer Encoder模块、STFT模块、ISTFT模块)
2024-06-05 17:45:00
1250
原创 大模型产品的选择:独特优势与个人倾向
在众多的大模型产品中,选择哪一款取决于个人的需求和偏好。字节豆包的个性化推荐、百度文心一言的搜索服务、阿里通义千问的电商分析和腾讯元宝的社交互动,每款产品都有其独特的优势和适用场景。用户在选择时应考虑自己的实际需求,以及产品的功能、使用成本和安全性等因素。
2024-06-05 17:45:00
730
原创 代码解读 | Hybrid Transformers for Music Source Separation[01]
对Hybrid Transformer Demucs代码进行解读[01],目标:明确各个模块对应的代码具体在工程的哪个地方。
2024-06-04 17:31:19
659
原创 如何评价GPT-4o?
总结来说,ChatGPT的每次迭代都紧密结合了市场的变化和用户需求,从初期的文本生成到多功能对话,再到多模态处理和专业领域应用,每一步都在满足和引领市场的需求。个性化、专业化、多模态、一定是未来GPT或者说智脑的必然选择。
2024-05-31 15:21:17
1558
原创 OSError: [Errno 117] Structure needs cleaning
解决:tempfile.NamedTemporaryFile 引发的OSError: [Errno 117] Structure needs cleaning问题
2024-05-31 13:04:52
1154
原创 如何让大模型更聪明?
要让大模型变得更聪明,关键在于确保训练数据的高质量和多样性。通过数据清洗、增强、多源集成、关注长尾数据、持续学习、多任务学习、对抗性训练和领域适应等策略,可以显著提升模型的泛化能力和适应性。这些方法可以帮助模型更好地理解和处理各种情况,使其在现实世界中的表现更加出色。
2024-05-28 12:29:03
377
原创 指定GPU运行程序&设置cmd运行的程序后台运行
在train文件中设置环境变量,让程序在指定GPU运行;使用tmux设置会话,保证远程连接断开,会话中的程序也会继续运行
2024-05-28 11:08:10
851
2
原创 AI商业化之路:开源大模型VS闭源大模型
评价一个AI模型“好不好”“有没有发展”,首先就躲不掉“开源”和“闭源”两条发展路径。对于这两条路径,你更看好哪一种呢?探讨开源大模型和闭源大模型在商业应用领域的优劣。
2024-05-23 17:17:57
1050
原创 Ubuntu环境|FileNotFoundError: [Errno 2] No such file or directory: ‘soundstretch‘
使用ubuntu命令sudo apt -y install soundstretch 安装soundstretch,解决FileNotFoundError: [Errno 2] No such file or directory: 'soundstretch'问题。
2024-05-23 16:31:41
277
原创 如何利用Ubuntu服务器运行深度学习项目?
如何利用Ubuntu服务器中运行深度学习项目?先配置好服务器端的软件环境(工程源码,miniconda,cuda,显卡驱动等),然后用自己电脑的pycharm远程连接服务器运行代码。一句话总结:借用服务器资源运行代码,本地pycharm只是方便看代码。
2024-05-20 17:00:01
1030
2
原创 音源分离 | Spleeter: a fast and efficient music source separationtool with pre-trained models
Spleeter 是一个用于音乐源分离的快速高效工具,它使用预训练模型U-Net。
2024-05-15 09:47:06
860
原创 音源分离 | Hybrid Spectrogram and Waveform Source Separation
本文提出了基于Demucs架构的的时域+频域的分离模型
2024-05-14 17:22:04
874
原创 音源分离|Music Source Separation in the Waveform Domain
本文提出了一种新的时域模型Demucs,它具有U-Net结构和双向LSTM
2024-05-14 13:29:42
1159
1
原创 代码复现|subprocess.run()导致报错“FileNotFoundError: [WinError 2] 系统找不到指定的文件“
subprocess.run()导致“FileNotFoundError: [WinError 2] 系统找不到指定的文件“问题
2024-05-11 14:35:30
3012
1
原创 代码复现|DataLoader类num_workers参数引发的进程问题
解决torch.utils.data.dataloader.DataLoader类,num_workers参数引发的进程问题
2024-05-10 10:13:40
519
原创 Agent AI智能体的未来:探索与挑战
我觉得:在GPT5、GPT6或者更高级别的智能体没有出现以前,垂直大模型在特定场景无法被通用大模型替代。在未来,如果更高的智能体出现了,垂直大模型可能也就失去了它存在的意义。因为,如果大的问题被解决了,小的问题也就顺带着被解决了。
2024-04-29 10:41:58
556
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人