
音乐音频
文章平均质量分 77
音乐声学、musictech音乐科技、音乐信息检索、音乐心理学、基础乐理
Begonia_cat
热爱音乐的Yilia~
展开
-
报错与解决:UFuncTypeError: ufunc ‘add‘ did not contain a loop with signature matching types (dtype(‘<U21‘
查阅资料,大家说是因为数字和字符串格式不匹配导致的。检查了一下,我的音乐文件命名均是数字名,所以。字符串相加就会报错。原创 2022-10-16 11:37:06 · 4652 阅读 · 0 评论 -
批归一化`x.mean(dim=0, keepdim=True)`
【代码】批归一化`x.mean(dim=0, keepdim=True)`原创 2022-09-02 14:25:28 · 623 阅读 · 0 评论 -
MFCC转音频,效果不要太逗>V<!
MFCC很好地表示了音频的频率特征。MFCC可以代表音频,作为深度学习端到端模型的输入(尽管实验证明,声谱图比MFCC有更好的性能)。那么MFCC转音频的效果是什么呢?本文将以巴赫《小步舞曲》为例,进行实验。(笔者最近对英语有狂热的兴趣,所以写文章时会想锻炼锻炼英语😄)...原创 2022-07-27 19:47:38 · 974 阅读 · 0 评论 -
拒绝噪声,耳机小白的入门之旅
买个耳机竟然学到这么多!原创 2022-07-25 03:24:48 · 983 阅读 · 2 评论 -
认识提取与显示梅尔谱图的小实验(观察不同y_axis和x_axis的区别)
音频梅尔谱图的小实验提取梅尔谱图显示梅尔谱图1、没有转化为对数谱时以梅尔标度显示频率以梅尔标度显示频率节奏(待续),还没搞太明白原创 2022-07-05 14:20:49 · 1728 阅读 · 3 评论 -
librosa | 梅尔谱图最幽默的解释
小白进来!Medium的一篇文章,特别幽默地介绍了梅尔谱图,快来一起轻松学习吧!原文:《Getting to Know the Mel Spectrogram》作者:Dalya Gartzman时间:2019.08.20阅读这篇短文,如果你想像Neo(电影《黑客帝国》男主角,即上图中的人物)一样,并了解所有关于的信息!(可能不会涵盖到梅尔谱图的全部内容,但至少有一点)我:嗨,梅尔频谱图,我可以叫你吗?梅尔:当然。我:谢谢。所以梅尔,当我们第一次见面时,你对我来说是一个谜。梅尔:真的吗?怎么样?我:,它们翻译 2022-06-21 01:51:54 · 2669 阅读 · 0 评论 -
基于CNN的音乐流派分类
作为音乐和数据的爱好者,将两者结合起来的想法听起来很诱人。翻译 2022-06-20 22:06:11 · 5065 阅读 · 2 评论 -
librosa | 梅尔谱图最通俗的解释
在Medium论坛,读到一篇关于梅尔谱图的帖子,作者讲得通俗易懂生动幽默,因此翻译过来分享一下。一则,为自己日后查阅方便,二则,帮助其他有困惑的小伙伴一起来学习学习。当然,如果有条件(as you know),建议直接去原链接读英文原版。话不多说,一起来读吧!原文链接:《Understanding the Mel Spectrogram》作者:Leland Roberts如果你像我一样,试图理解并不是一件容易的事。你读了一篇文章,却被引向了另一篇文章…和另一个…和另一个…继续前进。我希望这篇短文能够澄清翻译 2022-06-20 15:34:11 · 15882 阅读 · 9 评论 -
音乐音频 | openSMILE提取6373维静态特征
因为要提取6373维静态特征,所以选用配置文件。提取后的文件提取的文件保存在文档中。如图,中共包含两部分内容:openSMILE提取后文件的处理真的好令人头疼,笔者目前没有找到好的方法。于是用完成了将生成文件转化为csv文件的过程。我的处理:将文档中的内容存至static_features_6371.csv文档中,如下:(一行为一首音乐,每首音乐共6373维特征)...原创 2022-06-04 00:29:04 · 477 阅读 · 0 评论 -
音乐音频 | openSMILE提取音频需要掌握的知识
注意:以下操作均需要在下载好的openSMILE的目录下执行。如:SMILExtract -C config_path -I input_path -O output_pathinput_path为 wav 所在的路径。output_path为:想要保存的文件位置与文件名。批量提取的时候,最好将特征与音频文件对应命名,单独保存到一个文件夹下,便于后续使用和分析。:正常报告:error,表示存在错误。:88维特征(2009-InterSpeech Emotion Challenge特征集):384维特征原创 2022-06-04 00:07:21 · 1578 阅读 · 0 评论 -
音乐音频 | openSMILE安装_windows_3.0版本
官网链接:https://www.audeering.com/research/opensmile/相关阅读:openSMILE学习原创 2022-06-01 23:46:18 · 1162 阅读 · 0 评论 -
Ctrl + 鼠标左键:跳转到对应的`定义位置`
在代码中,想要查看一个函数或变量的定义位置时,可以将鼠标放在想要查看的对象上 ,按,即可。例如:想要查看的定义位置,直接将光标放在该位置:即可跳转到定义位置:原创 2022-06-01 22:54:38 · 2167 阅读 · 1 评论 -
报错与解决 | AttributeError: module ‘librosa.feature‘ has no attribute ‘rmse‘
rmse → rms代码:rmse = librosa.feature.rmse(y=y)报错:AttributeError: module 'librosa.feature' has no attribute 'rmse'解决:更改代码为rmse = librosa.feature.rms(y=y)原创 2022-05-31 16:18:22 · 2082 阅读 · 0 评论 -
librosa实现音频格式转换(单曲&批量) | MP3转wav
文章目录step1:环境要求①安装ffmpeg②安装librosa③安装soundfilestep2:4行代码完成转换①导包②读入需要处理的MP3文件③用soundfile重写成wav综上,完整代码如下:step1:环境要求①安装ffmpeg这一步很关键。如果没有ffmpeg,librosa读取MP3文件时就会报错。见笔者的文章:ffmpeg安装②安装librosapip install librosa③安装soundfilepip install soundfilestep2:4原创 2022-05-25 01:10:38 · 3834 阅读 · 1 评论 -
报错与解决 | RuntimeError: Error opening File contains data in an unknown format.
文章目录问题描述报错原因解决方法1、下载ffmpg2、把`ffmpeg.exe`复制到项目文件夹3、打开anaconda中项目所在位置的“ffdec.py”问题描述总结一下:报了俩错误:1、RuntimeError: Error opening File contains data in an unknown format.2、NoBackendError报错原因无法识别MP3格式的文件,换言之:没有安装ffmpeg解决方法1、下载ffmpgffmpeg安装教程安装完成的结果显示原创 2022-05-25 00:34:04 · 3000 阅读 · 0 评论 -
MOOC《基础和声》笔记
和声学基础入门笔记原创 2021-12-28 10:42:45 · 6146 阅读 · 0 评论 -
音乐音频 | 信号特征分析ADSR
文章目录一、ADSR(Attack,Decay,Sustain,Release)1、定义2、应用(1)ADSHR(H:hold)(2)AHDSR(H:hold)(3)反向ADSR包络二、一、ADSR(Attack,Decay,Sustain,Release)1、定义包络是描述音量变化的曲线。ADSR常用于电子音乐乐器的声音设计,描述了 声音从 无 到 有 再到 无 这一过程中 包络的变化。ADSR与乐器的发声原理有关,包含Attack(上升时间),Decay(衰减时间),Sustain,Relea原创 2021-09-25 16:43:35 · 1636 阅读 · 0 评论 -
声学行业 | 音乐与声音学术周 笔记
文章目录从音响层面对好莱坞电影中的流行音乐与格莱美获奖音乐进行比较中国传统艺术审美与跨模态关联基于语音识别的智能网络音频终端设计 乔琼空间声拾音方法研究与展望从音响层面对好莱坞电影中的流行音乐与格莱美获奖音乐进行比较石晋阶 谢坤助 指导老师:华伟数据选择电影中的流行音乐:在互联网电影资料库( IMDb )有史以来最佳的100部电影中选择了7个好莱坞电影原声音乐片段,及每个片段对应音乐的单曲发行版本。音乐风格涵盖了流行、摇滚、说唱、放克、民谣。市场中的流行音乐:从2014至2020年格莱美获奖音乐中原创 2021-09-25 16:41:45 · 655 阅读 · 0 评论 -
音乐音频 | 语音识别与音乐流派分类
文章目录元音Vowel贝尔实验室STT(speech to text):语音转化成文本TTS(text to speech):文本转化为声音连续语音识别 continuous speech recognizer语音识别——黑盒子实现 不同时长 不同口音 相同文本 的语音 正确转化step:1、声波输入计算机 decoding2、将声波sound waves 转化为 数字 进行存储。声波是一维的,只需要等距地记录 波的高度3、抽样sampling ,每秒钟读取N个样品。奈奎斯特定理:原创 2021-09-17 15:35:59 · 2482 阅读 · 2 评论 -
数理工具 | 统计学笔记
相关系数:当一个变量发生变化时,另一个变量如何变化。相关系数是反映两个变量之间关系的量化指标。值域范围-1到1。反映变量发生变化时,变化的方向是相反的还是相同的。如果相同,则是直接相关或正相关。如果相反,则是间接相关或负相关。讨论的是一个群体在两个变量上的表现,而不是特定的个人。相关系数的绝对值反映相关强度。相关系数用r表示,r的下标表示相关的两个变量,如rXY表示变量X与变量Y之间的相关系数。如果一个变量的值不发生变化(如年龄都相同,那么年龄就不能算为变量),那么两个变量之间不相关,相关系数为0。如果对原创 2021-08-03 13:16:39 · 486 阅读 · 0 评论 -
音乐心理学 | 书籍推荐
近三周都为了完成实验心理学的作业,查阅了各种书籍文献资料。作为一名热爱音乐的声学学习者,笔者最开始就把自己的实验方向定为音乐心理学,在这个很窄的领域进行探索。目前对音乐心理学的研究现状有了相对系统的了解,了解了一些这门学科的研究领域,但依旧没有创新思路。音乐心理学是音乐与心理学的交叉学科,在研究音乐的同时,采用实验心理学方法探究听音乐过程中“人”的心理反应,从而探寻出音乐音响在听觉层面的奥秘。在阅读的这些资料中,下述这几本书对音乐心理学领域、音乐美学的介绍十分系统,可以作为入门的参考资料。首先是周海宏老原创 2021-07-24 18:36:41 · 1025 阅读 · 3 评论 -
音乐心理学 | 《聆听心声》笔记
作品的伟大不在于表现的内容,而在于表现的形式。不是你缺少审美能力,而是你没能启动感性思维。如果你读小说读的只是历史、故事、知识,就说明你还没有把文学当做艺术去欣赏。音乐给人的感受绝不仅仅是纯听觉的感受。有时人们对音乐的反应具有高度的共识,这是一个重要的心理反应机制——联觉。“联觉”是人类的基本感觉反应。联觉是艺术家感受世界的方式。联觉是否发达而敏感,决定着你的艺术才气。音乐表现各类内容的方法:1、真实音响模拟手法如:百鸟朝凤2、符号对应化手法3、伴随经验联想前三种原创 2021-08-03 13:05:44 · 3279 阅读 · 0 评论 -
librosa | 系统实战(一 ~ 四)
librosa是python中用于提取音乐特征的库一、安装参考 https://blog.youkuaiyun.com/qq_39516859/article/details/80333431二、原创 2021-08-13 22:51:47 · 11653 阅读 · 17 评论 -
librosa | 系统实战(十八~十九)写音频&音乐
文章目录[librosa学习(一 ~八)点此处](https://blog.youkuaiyun.com/qq_44250700/article/details/119685358)九、写音频(1)soundfile.write(2)缩放音频subplot绘图代码:(3)线性组合和混音(4)变速(更改采样率)(5)变调(6)变声(7)加载、拼接、截取、叠加、静音、调整音量①加载音频文件②音频拼接③音频截取④音频叠加⑤生成静音音频⑥调整音频音量十二、音乐(1)音高pitch and 曲调tuning(2)回音(3)间断(原创 2021-08-27 18:14:09 · 10900 阅读 · 4 评论 -
librosa | 系统实战(五~十七)
文章目录十、librasa.core...Spectral representations(1)librosa.core.stft 输出帧数说明:(2)librosa.core.istft(3)librosa.core.ifgram(4)librosa.core.cqt十一、Audio processing(1)librosa.effects.split(2)librosa.core.load(3)librosa.core.to_mono(4)librosa.core.resample(5)librosa.原创 2021-08-27 16:41:34 · 9291 阅读 · 2 评论 -
librosa | windows安装pyaudio包
一、报错经历二、windows安装pyaudio包的方法原创 2021-08-27 15:47:01 · 435 阅读 · 0 评论 -
甜蜜的期待 | 前言&致谢
本书描述了一种关于期望的心理学理论。我称它为ITPRA理论–这个名字将在第一章中加以解释。当我开始这项研究时,我的兴趣仅限于音乐。我的目标是更好地理解听众如何形成与音乐有关的期望,以及这些期望如何解释各种情绪反应。随着工作的进展,ITPRA理论演变成了一种普遍的期望理论,因此,它超出了我对音乐的狭隘关注。虽然我的主要动机仍然是音乐,但这本书应该被证明对认知科学和进化心理学感兴趣的更多普通读者有参考价值。对于音乐家和音乐学者来说,本书对诸如节拍、切分音、腔调、调性、无调性和形式等古老的主题提供了基于心理学的翻译 2021-07-15 17:37:23 · 259 阅读 · 0 评论 -
听音乐的心理功能
听音乐的心理功能人们为什么要听音乐?在过去的几十年里,学者们提出了许多听音乐可能实现的功能。然而,不同的理论方法、不同的方法和不同的样本在音乐功能的数量和性质方面留下了异质的画面。此外,对于这些功能的潜在维度仍未达成一致。论文的第一部分回顾了明确提到音乐功能的研究贡献。结论是,有必要对音乐聆听的众多功能背后的基本维度进行全面调查。本文的第二部分对可以从审查的贡献中提取的数百个函数进行了实证研究。这些功能被提炼为129 个非冗余功能,然后由 834 名受访者进行评分。主成分分析提出了三个不同的潜在维度:人们翻译 2021-07-16 14:07:01 · 784 阅读 · 0 评论 -
音乐心理学 | 乐理知识
意大利术语:D.C. al Fine,意为:从头反复,到Fine结束。原创 2021-07-14 12:07:19 · 4647 阅读 · 0 评论 -
甜蜜的期待 | 简介
Sweet Anticipation: Music and the Psychology of ExpectationDavid Huron世界提供了无穷无尽的可能会让我们感到惊讶、高兴、恐惧或厌烦的事件。这些情绪提供了定义我们个人生活的亲密体验。有时,情绪是压倒性的——比如当我们经历巨大的快乐或巨大的痛苦时。更多的时候,情绪会增加微妙的细微差别,使我们对世界的感知更加丰富多彩。情绪增加了存在的深度;它们赋予生命以意义和价值。情绪是如何产生的?它们有什么作用?是什么原因使我们体验到独特的情感?这翻译 2021-07-15 22:11:47 · 492 阅读 · 0 评论