音视频
文章平均质量分 82
音视频技术涉及音频和视频的采集、处理、编码、传输、解码及播放等多个环节,广泛应用于直播、视频会议、在线教育、娱乐等领域。音频基础:采样率、位深、声道、编码格式。视频基础:分辨率、帧率(FPS)、色彩空间、编码格式。编解码(Codec):压缩原理、常见工具。传输协议:实时传输、流媒体、新兴协议。
109702008
数字人 - 幺洞勾拐洞两洞洞八
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
AI视频生成工具完全指南:从Sora到开源替代方案全解析
AI视频生成工具全指南:解锁创作新可能 本文全面介绍了当前AI视频生成领域的各类工具,帮助创作者快速找到适合自己的解决方案。文章首先分析了OpenAI的Sora及其访问限制,随后推荐了DIGEN Sora、GAGA-1等优质免费替代方案,并详细介绍了Ovi、MoneyPrinterTurbo等开源工具的特性与部署方式。此外,还提供了Midjourney+Ovi等组合工作流建议,以及按使用场景和硬件条件的工具选择指南。最后展望了AI视频生成技术未来将向更高质量、更低门槛、更丰富生态发展的趋势,鼓励创作者善用这原创 2025-10-16 16:18:10 · 455 阅读 · 2 评论 -
调性的魔方:从F大调到B♭ Lydian的音响密码
本文系统梳理了降号调体系的核心脉络,以F大调为起点(含降B音),逐步延伸至降B大调(双降号)及更复杂的降号调。重点解析了B♭Lydian调式的独特构成(含E自然音而非降E)及其音响特征,揭示了半音变化带来的调式革新。文章还从实践角度阐述了降B调在古筝转调、键盘乐器演奏中的具体应用技巧,并探讨了其在管乐、爵士和弦中的特殊地位。通过F大调到B♭Lydian的演进路径,展现了音乐理论中"规则建立-突破"的创造性循环。原创 2025-08-07 07:56:11 · 1569 阅读 · 0 评论 -
歌曲《忘尘谷》基于C语言的歌曲调性检测技术解析
通过C语言结合信号处理库,可实现歌曲调性的自动化检测,但需兼顾技术细节与音乐理论。:统计音高分布,匹配大调或小调音阶特征(如D大调音阶:D-E-F♯-G-A-B-C♯)。),探讨如何实现调性检测,并通过实际案例《忘尘谷》分析程序结果与简谱标记的差异。:D大调与B小调共享调号(两个升号),程序可能捕捉到B小调的主音。:引入和弦分析或机器学习模型(如CNN)提升复杂音乐的检测精度。:基频检测易受和弦或伴奏干扰,需结合音阶分布优化逻辑。:程序检测《忘尘谷》主音为B,而简谱标记为1=D。:未安装FFTW开发库。原创 2025-05-12 13:12:18 · 2134 阅读 · 3 评论 -
使用 librosa 测量《忘尘谷》节拍速度
在音乐分析与处理领域,准确测量音频的节拍速度(BPM)至关重要。librosa 是一个强大的 Python 音频分析库,本文将通过多个函数示例展示如何使用 librosa 测量刘珂矣演唱的《忘尘谷》的节拍速度,并分析不同方法的效果。原创 2025-05-10 19:14:00 · 1638 阅读 · 0 评论 -
科学唱准音阶的终极指南:从理论到实践的全方位训练法
唱准音阶需要长期系统训练,核心在于听觉敏锐度、发声控制力、节奏稳定性三者的结合。初期可通过工具辅助和分阶练习打好基础,后期逐步融入音乐表达。若遇到瓶颈,建议结合专业声乐课程(如施耐德发声法)进行系统性提升。将音阶唱准是声乐和音乐学习的基本功,需要通过科学的训练和持续的练习来提升。1. 培养听觉敏感度(关键基础)听音训练:多听标准音(如钢琴、调音器发出的A4=440Hz),记住每个音的音高和音程关系。模唱练习:先用乐器弹一个音(如中央C),然后模仿唱出相同的音高,逐渐扩展到音阶、音程。辨音游戏。原创 2025-05-11 00:15:00 · 1867 阅读 · 0 评论 -
D大调:音乐中的辉煌之声
D大调如同音乐世界中的金色桥梁,连接着严谨的乐理规则与鲜活的情感表达。无论是古典巨匠笔下的恢弘乐章,还是流行歌手吟唱的动人旋律,D大调始终以其独特的音色魅力,在时间的长河中持续回响。理解并掌握这一调式,将为音乐创作与鉴赏打开新的维度。D大调是以D音为主音的大调,其音阶结构遵循“全音-全音-半音-全音-全音-全音-半音”的大调模式。音阶构成。音阶遵循大调音程排列规则“全音-全音-半音-全音-全音-全音-半音”(W-W-H-W-W-W-H)。原创 2025-05-10 00:30:00 · 2010 阅读 · 0 评论 -
音程与音级:解码音乐理论的基石
两次大二度:最终音为本音的纯四度(如C→E)。两次小二度:理论上回到等音,但实际中需谨慎使用。混合方向:结果取决于大小二度的组合顺序。建议结合具体音阶或和声语境分析,以确定最符合音乐逻辑的答案。原创 2025-05-08 00:30:00 · 2274 阅读 · 0 评论 -
《忘尘谷》曲谱的深度解析:从音高映射到调性逻辑与演奏实践
忘尘谷》的曲谱设计,是音乐理性与感性的完美融合。从音高的科学映射到调性的逻辑推导,从音程的物理本质到升八度的灵活应用,每一步均体现音乐理论的深度与演奏实践的智慧。理解这些核心要素,不仅能提升演奏的精确性,更能深入感知作品的艺术灵魂——在音符的规律中,听见山谷的回响与心灵的共鸣。各音音高(科学音高记号)低音5→A3低音6→B3(已知条件)低音7→C♯4中音1→D4中音2→E4中音3→F♯4中音4→G4中音5→A4中音6→B4中音7→C♯5高音1→D5曲谱的调性调性为D大调。原创 2025-04-19 00:30:00 · 2481 阅读 · 1 评论 -
12孔AG调陶笛音域全解析:从E4到C6的演奏艺术
这把12孔AG调陶笛犹如一件精密的声学仪器,E4-C6的音域既是物理结构的创新突破,更是音乐表达的维度拓展。演奏者需理解其声学特性与人体工学的精妙平衡,方能在13度音程间游刃有余。正如制笛大师帕斯夸里所言:"陶笛的极限不在黏土中,而在演奏者的气息里。主孔全按:在12孔陶笛中,主孔全按通常指的是将所有正面的指孔全部按住。对于AG调陶笛来说,主孔全按可能发出的是低音区的某个音,但具体音高取决于陶笛的设计和调音。附孔全按:附孔通常指的是位于陶笛背面或侧面的额外指孔。原创 2025-04-18 00:15:00 · 1675 阅读 · 0 评论 -
音乐理论中的音高、音阶与调性解析
C(1/Do)—D(2/Re)—E(3/Mi)—F(4/Fa)—G(5/Sol)—A(6/La)—B(7/Si)—C(高八度Do)C(1/Do)—D(2/Re)—E(3/Mi)—F(4/Fa)—G(5/Sol)—A(6/La)—B(7/Si)—C(高八度Do)需明确使用SPN体系(C4为中央C)。A4(第四八度的A音)→ B4(第四八度的B音)→ C5(第五八度的C音),同样遵循字母顺序和半音关系。B3与C4在钢琴上是相邻的白键(无黑键间隔),B3位于C4左侧(低音区),两者构成半音(小二度)。原创 2025-04-15 00:30:00 · 4143 阅读 · 0 评论 -
简谱中的“1=B”:调性、大调与小调的奥秘
B大调”和“B小调”的命名源于音阶结构的根本差异,而非单纯的主音名称。大调与小调的区别,本质上体现了音乐中“光明与黑暗”的情感对立,是作曲家表达情绪的核心工具。在简谱系统中,若要明确表示B小调,通常需基于关系大调的原理进行标注。B小调的简谱标记关系大调法(标准理论标注):B小调的关系大调是D大调(两者调号均为2个升号:F♯、C♯)。根据简谱首调唱名法,B小调的主音(la)对应D大调的第六级音,即6=D。因此,B小调的标准简谱标记为:6=D。原创 2025-04-05 00:15:00 · 2286 阅读 · 0 评论 -
C大调中的A4=440Hz:音乐、物理与认知的交响
引言:在音乐的世界里,每个音符都是一个独特的存在,它们按照特定的规则和比例相互交织,创造出和谐的旋律。在众多音符中,A4=440Hz作为一个国际标准音高,它在C大调中扮演着“la”的角色。这一看似简单的对应关系,实则是音乐理论、物理学原理和人类认知三者精妙平衡的体现。本文将深入探讨这一现象,揭示其背后的科学与艺术。一、音名与唱名:音乐的双重语言音乐中有两种命名系统:音名(如A、B、C)和唱名(如do、re、mi)。音名代表绝对频率,而唱名则表示调式中的相对位置。原创 2025-03-01 20:02:55 · 2952 阅读 · 0 评论 -
半音密码:解码音乐的最小量子单位
半音是十二平均律中最小音高差(频率比≈1.0595)原创 2025-03-01 19:24:29 · 1217 阅读 · 0 评论 -
《忘尘谷》音阶与调性解析
旋律主线条的核心区域,B4(中音6)作为导音推动至C♯5(中音7),再解决到高音1(D5),形成典型的调性回归711。根据音高范围的规律,低音6是B3,低音7是C4,中音1是D4,依此类推,高音1就是D5。例如,古筝谱显示《忘尘谷》是D调,而曲谱也显示《忘尘谷》的曲调是1=D。考虑到《忘尘谷》的音乐风格和乐器演奏特点,如古筝、笛子等,这些乐器在D调下演奏时,音域可以覆盖到D5这个音高。因此,实际演奏调性为。《忘尘谷》的高音1是D5,曲谱的调性是D调。综上所述,《忘尘谷》的高音1是D5,曲谱的调性是D调。原创 2025-04-16 00:15:00 · 1360 阅读 · 0 评论 -
使用Python分析歌曲调性:方法与实战
本文详细介绍了如何用C语言实现音频BPM检测,并提供了完整的代码实现与优化方案。核心实现原理包括音频读取、预处理、能量计算、峰值检测和BPM计算。关键技术点涉及音频读取、单声道转换、低通滤波、能量计算、动态阈值和间隔统计。文章还提供了完整的代码实现,包括依赖安装和核心代码,并提出了关键优化策略,如窗口大小调优、动态阈值算法和频段聚焦优化。验证与调试方法包括可视化调试、专业工具验证和性能指标对比测试。文章还探讨了典型问题解决方案,如高BPM误检和漏检真实节拍,并提出了扩展应用与优化方向,如实时BPM检测、机器原创 2025-05-25 00:15:00 · 381 阅读 · 0 评论 -
使用C语言实现音频BPM检测:从原理到实战
本文详细介绍了如何使用C语言实现音频BPM(Beats Per Minute)检测,并提供了完整的代码实现与优化方案。BPM是音乐节奏分析的核心指标,广泛应用于DJ混音、健身音乐匹配、音频编辑等领域。文章首先阐述了BPM检测的核心实现原理,包括音频处理流程(音频读取、预处理、能量计算、峰值检测、BPM计算)和关键技术点(如音频读取、低通滤波、动态阈值、间隔统计等)。随后,提供了完整的C语言代码实现,涵盖了音频读取、单声道转换、低通滤波、窗口能量计算、动态阈值检测、峰值检测和BPM计算等步骤。文章还提出了关键原创 2025-05-24 00:30:00 · 370 阅读 · 0 评论 -
基于C语言的歌曲调性检测技术解析
在音乐分析与数字信号处理领域,自动检测歌曲调性是一项基础且关键的任务。本文以C语言为核心,结合音频处理库()和快速傅里叶变换库(),探讨如何实现调性检测,并通过实际案例《忘尘谷》分析程序结果与简谱标记的差异。支持格式:通过库读取WAV等无损格式音频文件。代码示例:#include <sndfile.h>SNDFILE *file;SF_INFO info;file = sf_open("input.wav", SFM_READ, &info);float *原创 2025-05-17 08:19:46 · 97 阅读 · 0 评论 -
ffmpeg转换视频编码
1.运行ffmpeg -codecs查看支持的编码器# ffmpeg -codecsffmpeg version N-103222-gf040c1e Copyright (c) 2000-2021 the FFmpeg developers built with gcc 4.9.2 (Debian 4.9.2-10+deb8u2) configuration: --enable-libx265 --enable-libx264 --enable-gpl libavutil 57原创 2022-03-09 18:34:48 · 5636 阅读 · 0 评论 -
MediaInfo
MediaInfo Mac版是一款开源、免费的、跨平台的媒体信息检测工具,利用它可以快速地检测出视频音频文件的详细信息。参考:[mediainfo]粗略了解关于CBR, VBR, CVBR - 简书 (jianshu.com)GitHub - MediaArea/MediaInfo: Convenient unified display of the most relevant technical and tag data for video and audio files.MediaInf原创 2021-10-27 11:02:51 · 371 阅读 · 0 评论 -
ffprobe 查看提取视频文件参数
ffprobe -v quiet -show_entries stream=index,codec_name,height,bit_rate -of csv test.mp4ffprobe -v quiet -show_entries stream=index,codec_name,height,bit_rate -of json test.mp4ffprobetest.mp4ffprobe -v quiet -print_format json -show_format -show_stre.原创 2021-09-21 14:07:53 · 747 阅读 · 0 评论 -
ffmpeg使用h264、h265编码转换
1、编译x264git clone https://code.videolan.org/videolan/x264.gitcd x264./configure --enable-shared --enable-static --disable-asmmakemake installx264, the best H.264/AVC encoder - VideoLAN2、编译x265hg clone http://hg.videolan.org/x265cd x265/buil.原创 2021-08-12 18:25:34 · 12114 阅读 · 2 评论 -
在直播软件开发过程中,常用的几种视频封装格式
1、AVI格式此格式的中文译名为音频视频交错格式,这种视频格式的优点是图像质量好,无损AVI可以保存alpha通道。缺点也不少,体积过于庞大,而且糟糕的是压缩标准不统一,最普遍的现象就是高版本Windows媒体播放器播放不了采用早期编码编辑的AVI格式视频,而低版本Windows媒体播放器又播放不了采用最新编码编辑的AVI格式视频。2、DV-AVI格式它是由索尼、松下、JVC等多家厂商联合提出的一种家用数字视频格式。数字摄像机就是使用这种格式记录视频数据的,这种视频格式的文件扩展名也是AVI,它可以转载 2021-08-05 15:09:39 · 3136 阅读 · 10 评论
分享