
音视频开发系统技术专题
这里包括你所知道的各个平台的音视频开发技术资料
52Babara
苦逼的程序猿,不过听着歌打点代码挺好。
展开
-
CentOS7 搭建Darwin Stream Server6.0.3流媒体服务
在CentOS7中编译安装Darwin Streaming Server首先需要进行一些必要的准备工作:yum install patch make gcc g++ //准备好软件暂存的目录,并从官网下载软件的源码:cd /opt/mkdir -p darwincd darwin在官网上https://macosforge.github.io/dss/源码下载完成后,...原创 2019-07-28 13:25:34 · 931 阅读 · 3 评论 -
kaldi中文语音识别_基于thchs30(8)
接上回,我们继续看run.sh#copy feats and cmvn to test.ph, avoid duplicated mfcc & cmvn #拷贝mfcc特征和cmvn到test.ph,避免重复的mfcc和cmvncp data/mfcc/test/feats.scp data/mfcc/test_phone && cp data/mfcc/test/cm...原创 2018-09-07 13:36:32 · 3176 阅读 · 7 评论 -
kaldi中文语音识别_基于thchs30(7)
接上回,mfcc特征咱们暂时看完了,总结一下,此处引用别人的分析:特征提取MFCCcompute-mfcc-feats.ccCreate MFCC feature files.Usage: compute-mfcc-feats [options...] <wav-rspecifier> <feats-wspecifier>其中参数rspecif...原创 2018-08-22 17:42:45 · 3361 阅读 · 0 评论 -
kaldi中文语音识别_基于thchs30(6)
接上回,其实上回我们在make_mfcc.sh中提取特性$cmd JOB=1:$nj $logdir/make_mfcc_${name}.JOB.log \ compute-mfcc-feats $vtln_opts --verbose=2 --config=$mfcc_config \ scp,p:$logdir/wav_${name}.JOB.scp ark:- \| ...原创 2018-08-20 10:18:14 · 2511 阅读 · 4 评论 -
语音识别基础知识及概念
转载 2018-08-10 18:58:51 · 1636 阅读 · 1 评论 -
kaldi中文语音识别_基于thchs30(5)
接上回if [ -f $data/segments ]; then #这里是查看data/mfcc/train下是否存在segments,如果存在则执行then后面的脚本,否则执行else后面的,这个文件不存在,所以之后调用else后面的处理 echo "$0 [info]: segments file exists: using that." split_segments="" for...原创 2018-05-23 17:37:37 · 6803 阅读 · 3 评论 -
kaldi中文语音识别_基于thchs30(4)
接上回,完成数据准备的工作后,shell显示说明已经创建这些文件完毕。 我们看到生成的spk2utt的文件格式是这样的:我们看到它是先是一个说话者id号 然后是这个说话者id下的所有名称,而word.txt和text是一样的。既然我们已经数据准备了,所以以后就不用再进行数据准备了,所以在下次运行run.sh时, 先注释掉相关数据准备的shell脚本。#data prep...原创 2018-05-16 14:08:47 · 4911 阅读 · 1 评论 -
kaldi中文语音识别_基于thchs30(3)
接上回,我们继续看run.sh#you can obtain the database by uncommting the following lines#[ -d $thchs ] || mkdir -p $thchs || exit 1#echo "downloading THCHS30 at $thchs ..."#local/download_and_untar.sh $thchs h...原创 2018-05-14 17:17:57 · 3722 阅读 · 3 评论 -
kaldi中文语音识别_基于thchs30(2)
接上回,我们需要修改cmd.sh. 如下:原创 2018-05-10 11:08:09 · 4288 阅读 · 1 评论 -
kaldi中文语音识别_基于thchs30(1)
首先,thchs30有两种数据库,kaldi运行的数据库最好是 thchs30-openslr, 将thchs30中的三个压缩包下载后放到kaldi/egs/thchs30 同级目录修改s5/run.sh里面的语音库路径 thchs30=......原创 2018-05-09 19:37:26 · 4755 阅读 · 1 评论 -
Kaldi中的并行化(转载)
简介使用Kaldi最理想的环境是配备集群任务分发工具,如Sun GridEngine。如果同时使用多个服务器组成的集群,还需要能同时访问的共享文件系统,如NFS。即便没有这些,你也可以在单个一台服务器上方便地安装Kaldi。在主示例脚本中,如egs/wsj/s5/run.sh,可以看到如下的命令steps/train_sat.sh --cmd "$train_cmd" \ 4200 40000...转载 2018-05-09 11:08:51 · 5605 阅读 · 0 评论 -
rtmp传输h.264视频的必备知识(一)
rtmp传输h.264视频流媒体的起始帧传输rtmp传输h.264视频流媒体是目前常见的功能,近日对其进行了一些研究及总结。要想利用rtmp协议将h.264流媒体顺利推流到rtmp服务器,就需要将已经编码好的h.264视频流媒体按照rtmp协议中flv的格式的一些规则,进行头封装及相应的封装才可以。我们知道,如果想要rtmp客户端连接服务端拉流,我们客户端是怎么知道数据源推流的视频大小...原创 2019-07-06 16:08:47 · 15295 阅读 · 6 评论 -
webrtc在linux系统(ubuntu18.04)下的编译
点击http://commondatastorage.googleapis.com/chrome-infra-docs/flat/depot_tools/docs/html/depot_tools.html进行查看depot_tools工具的linux下的安装方式主要是在 git clone https://chromium.googlesource.com/chromium/too...原创 2018-12-10 19:59:01 · 7777 阅读 · 1 评论 -
webrtc的linux(CentOS7)下的编译方法(webrtc本身不支持Centos,请看文章最后)
点击http://commondatastorage.googleapis.com/chrome-infra-docs/flat/depot_tools/docs/html/depot_tools.html进行查看depot_tools工具的linux下的安装方式主要是在git clone https://chromium.googlesource.com/chromium/too...原创 2018-12-10 16:57:53 · 5019 阅读 · 2 评论