
音视频
文章平均质量分 90
TedSmile
Android、人工智能、深度学习、人脸识别
展开
-
音视频码率介绍
一、码率概念码率就是数据传输时单位时间传送的数据位数,一般我们用的单位是kbps即千位每秒。二、码率分类1、CBR:constant bitrate 固定码率2、VBR:variable bitrate 可变码率三、视频清晰度在码率一定的情况下,分辨率与清晰度成反比关系:分辨率越高,图像越不清晰;分辨率越低,图像越清晰。在分辨率一定的情况下,码率与清晰度成正比...原创 2019-10-30 09:59:37 · 1584 阅读 · 0 评论 -
WebRTC的噪声抑制(noise suppression,NS)算法
WebRTC噪声抑制核心算法在ns_core.c文件里。噪声频谱可以使用如语音/噪声似然函数进行估计。将接收到的每帧信号和频率分量分类为噪声或语音。算法原理该算法的核心思想是采用维纳滤波器抑制估计出来的噪声。上式中x和n分别表示语音和噪声,而y表示麦克风采集到的信号。它们的频谱关系如上,从上图可以看出语音和噪声是加性且不相关的关系,对于非加性关系可以有AEC等算法对不同...转载 2019-10-24 09:26:56 · 2787 阅读 · 0 评论 -
ffmpeg ffplay ffprobe 常用命令
一、ffmpeg1、yuv和jpg转换ffmpeg -i a.jpg -s 640x480 -pix_fmt yuv422p a.yuvffmpeg -pix_fmt yuv422p -s 640x480 -i a.yuv b.jpg2、查看支持哪些格式ffmpeg -pix_fmts3、mp3转pcmffmpeg -i audio1.mp3 -f s16le audio...原创 2019-05-10 09:49:16 · 1330 阅读 · 0 评论 -
WAV文件格式
1、文件格式2、文件头结构体定义,共44字节// WAVE file header formattypedef struct _WavHeader_s{ MI_U8 riff[4]; // RIFF string MI_U32 ChunkSize; // overall size of file in by...原创 2019-07-03 14:15:27 · 528 阅读 · 0 评论 -
非特定人语音识别模块
方案一:承芯卓越 HBR620/HBR640/HBR740方案二:TELESKY LD3320方案三:科大讯飞原创 2019-02-15 17:33:15 · 2252 阅读 · 2 评论 -
H.264、H.265相关知识点笔记
1、x264官网https://www.videolan.org/developers/x264.html2、x264 git仓库git clone https://code.videolan.org/videolan/x264.git3、H264码流的打包方式一种为annex-b byte stream format 的格式,这个是绝大部分编码器的默认输出格式,就是每个帧的开...原创 2019-09-19 10:06:21 · 1144 阅读 · 0 评论