
语音处理
文章平均质量分 58
我是小超斌
这个作者很懒,什么都没留下…
展开
-
SummerTTS - 开源本地编译运行,没有任何依赖,不需要联网,开箱即用的语音合成(TTS)项目
SummerTTS 是一个基于C++的独立编译的中文语音合成项目,可以本地运行不需要网络,而且没有额外的依赖,一键编译完成即可用于中文语音合成。GitHub - huakunyang/SummerTTS: SummerTTS 是一个基于C++的独立编译的中文语音合成项目,可以本地运行不需要网络,而且没有额外的依赖,一键编译完成即可用于中文语音合成。本项目在 Ubuntu 上编译运行通过,其他类Linux平台,如Android,树莓派等,也应该没啥大问题,在Window上没有测试过,可能需要少许改动。转载 2023-12-21 15:57:29 · 410 阅读 · 0 评论 -
webRTC-audio-processing 编译
out:创建空目录,在这下面执行 cmake.. 生成 Makefile 之后再执行 make 进行编译,最终得到的测试项目可执行文件 webtrc-audio-process。项目源码:https://e.coding.net/TangYuFan/speech-processing/WebRTC-AudioProcessing-main.git。webrtc-audio-processing:就是第一步编译官方模块的目录。CMakeLists.txt:编写编译配置生成文件。转载 2023-07-28 10:22:42 · 469 阅读 · 0 评论 -
音频编解码FAAC PCM转AAC
采样率,声道数(双声道还是单声道?),还有你的WAV的单个样本是8位的还是16位的?这里的安装过程是在 Mac 和 Linux 上实现的,Windows可以类似参考。关闭编码器,另外别忘了释放缓冲区,如果使用了文件流,也别忘记了关闭。,该准备的刚才都准备好了,很简单。转载 2023-07-28 10:15:24 · 285 阅读 · 0 评论 -
AVFilter - 流媒体过滤器
文章目录**流媒体过滤器 - AVFilter****函数说明** :**函数名称** : **avfilter_graph_alloc****功能** : 相当于合拢所有过滤器的统一上下文**avfilter_init_str参数选项**:**abuffersink ( 媒体数据最终出口 ) ****aformat ( 将媒体数据进行格式化 )****amix ( 混音处 )**:**abuffer ( 媒体数据入口 )**转载 2023-07-14 14:58:26 · 230 阅读 · 0 评论 -
ffmpeg进行混音,将两路音频pcm数据合成一路输出
PCM重采样进行混音转载 2023-07-14 10:47:12 · 945 阅读 · 0 评论 -
PCM音频混合的方法
方法:为避免发生溢出,使用一个可变的衰减因子对语音进行衰减。这个衰减因子也就代表语音的权重,衰减因子随着音频数据的变化而变化,所以称为自适应加权混音。当溢出时,衰减因子较小,使得溢出的数据在衰减后能够处于临界值以内,而在没有溢出时,又让衰减因子慢慢增大,使数据较为平缓的变化。思路:使用更多的位数(32 bit)来表示音频数据的一个样本,混完音后在想办法降低其振幅,使其仍旧分布在16 bit所能表示的范围之内,这种方法叫做归一法;3、PCM脉冲编码的音频信号的混音实现,2、归一化混音(自适应加权混音算法)原创 2023-07-14 10:24:22 · 3586 阅读 · 1 评论