
音频处理
一摩尔自由
AI之路
展开
-
音频特征提取——python/ librosa工具包使用
前言 本文主要记录librosa工具包的使用,librosa在音频、乐音信号的分析中经常用到,是python的一个工具包,这里主要记录它的相关内容以及安装步骤,用的是python3.5以及win10环境。一、MIR简介音乐信息检索(Music information retrieval,MIR)主要翻译自wikipedia.MIR是从音乐中检索信息的跨学科科学,该领域需要心理学、乐理学、信号处理、...原创 2018-07-16 15:29:27 · 13248 阅读 · 0 评论 -
关于音频AEC\AGC\BSS\BF\DOA\NS\DER算法名词解释
关于音频算法的一些缩写网上不好直接找到,最近整理了一下~名词解释AEC(Auto echo cancellation):自适应回声消除AEC算法早期用在Voip,电话这些场景中,自从智能设备诞生后,智能语音设备也要消除自身的音源,这些音源包括音乐或者TTS机器合成声音。回声消除的基本原理是使用一个自适应滤波器对未知的回声信道:ω \omegaω 进行参数辨识,根据扬声器信号与产生的多...原创 2019-08-12 13:30:30 · 9057 阅读 · 1 评论 -
Python对批量wav文件改名
sample = r"C:\Users\Administrator\Desktop\aws-3 " files = os.listdir(sample) files = [sample + "\\" + f for f in files if f.endswith('.wav')] num = len(files) threshold_value = 1 check_repeat =...原创 2018-11-20 12:59:32 · 1541 阅读 · 0 评论 -
python wav文件短时能量并plot出来
import waveimport pyaudioimport numpy as npimport pylabimport pylab as pl# 计算每一帧的能量 256个采样点为一帧def calEnergy(wave_data) : energy = [] sum = 0 for i in range(len(wave_data)) : ...原创 2018-11-17 11:45:30 · 2360 阅读 · 0 评论 -
python wav文件过零率并plot出来
import mathimport waveimport numpy as npimport pylab as pldef ZeroCR(waveData,frameSize,overLap): wlen = len(waveData) step = frameSize - overLap frameNum = math.ceil(wlen/step) ...原创 2018-11-17 11:43:50 · 804 阅读 · 0 评论 -
python 声音变速不变调实现
import ctypesimport numpy as npfrom numpy.ctypeslib import ndpointerfrom scipy.io import wavfilelib = ctypes.cdll.LoadLibrary sonic_lib = lib("lib/sonic-master/libsonic.so")fs, wav = wavfile...原创 2018-11-19 15:56:06 · 6691 阅读 · 2 评论 -
振铃信号、拨号音、回铃音、忙音详解
转自:https://www.cnblogs.com/sddai/p/8847950.html1、振铃信号用来呼叫被叫用户。铃流为25±3Hz正弦波,谐波失真不大于10%,输出电压有效值90+-15V,振铃采用5s断续,即一秒送,4s断,断、续时间偏差不超过±10%。2、拨号音用来通知主叫用户可以拨号。拨号音采用频率为450±25Hz的交流电源,发送电平为-10±3dBm,是连续的信...转载 2018-11-05 16:11:56 · 10918 阅读 · 0 评论 -
18个实时音视频开发中会用到开源项目
实时音视频的开发学习有很多可以参考的开源项目。一个实时音视频应用共包括几个环节:采集、编码、前后处理、传输、解码、缓冲、渲染等很多环节。每一个细分环节,还有更细分的技术模块。比如,前后处理环节有美颜、滤镜、回声消除、噪声抑制等,采集有麦克风阵列等,编解码有VP8、VP9、H.264、H.265等。 我们今天汇总了一些能帮助到正在学习或进行音视频开发的实时音视频开发者们的开源项目与几个...转载 2018-11-06 16:33:29 · 737 阅读 · 0 评论 -
Python对批量wav文件加入高斯白噪声
#coding=gbkimport osimport waveimport librosaimport numpy as npdef add_noise(data): wn = np.random.normal(0,1,len(data)) data_noise = np.where(data != 0.0, data.astype('float64') + 0.02...原创 2018-10-30 16:27:06 · 4510 阅读 · 2 评论 -
Python对批量文件进行VAD检测和分段
准备:python2.7/3.+ webrtcvadimport collectionsimport contextlibimport sysimport waveimport osimport webrtcvaddef read_wave(path): """Reads a .wav file. Takes the path, and returns...原创 2018-10-26 18:10:27 · 6588 阅读 · 5 评论 -
Python对批量音频文件(wav)进行分段切割并保存
#coding=gbkimport osimport waveimport numpy as npimport pylab as pltCutTimeDef = 1 #以1s截断文件# CutFrameNum =0path = r"..\test"files = os.listdir(path)files = [path + "\\" + f for f in fi...原创 2018-10-25 16:41:54 · 22416 阅读 · 9 评论 -
声纹识别
探秘身份认证利器——声纹识别!声纹识别神秘面纱在这个移动互联网大行其道的年代,人们不用互相见面就可以完成很多事情,比如社交、购物、网上开店、金融交易等等,但是如何验证身份变成了人和人在不见面的情况下最难的事情。传统的解决方案就是密码或者秘钥,它需要你记住或者存起来,容易忘又容易丢,还容易被黑客利用各种手段攻击。有多少人使用“123456“这种简单密码在网络上行走,他们就是黑客们最喜欢的目标...转载 2018-09-21 10:48:12 · 2508 阅读 · 2 评论 -
语音增强及相关算法
一、概况及现状1、语音增强的目标:受体是机器,目标是提高语音的可懂度(intelligibility)受体是人,目标是提高语音的质量(quality)2、语音增强的任务:语音降噪、语音分离、语音解混响,增强技术很多情况下并不是独立的,而是需要联合处理和优化。例如,语音解混响与降噪,卷积盲源分离与降噪等等3、研究现状和趋势:语音增强主要包括三个方面:语音降噪、语音分离和语音解混响(可以包含回声消除)...原创 2018-07-11 15:56:43 · 33253 阅读 · 4 评论 -
音频编解码
https://www.cnblogs.com/skyofbitbit/p/3651270.htmlhttps://www.cnblogs.com/imstudy/p/10289944.html音频编解码常用的实现方案有三 种: 第一种就是采用专用的音频芯片对 语音信号进行采集和处理,音频编解码算法集成在硬件内部,如MP3编解码芯片、语音合成 分析芯片等。使用这种方案的优点就...原创 2019-09-05 14:51:33 · 1213 阅读 · 0 评论