- 博客(174)
- 资源 (38)
- 收藏
- 关注

原创 linux各种命令手册
linux命令手册常见命令常见命令命令含义find . -name “words.txt” -exec ls -lh {} ;查找当前目录下的所有words.txt文件并显示详情export CUDA_VISIBLE_DEVICES=0,1设置GPU可见设备...
2019-12-22 19:39:07
4190
3

原创 markdown技巧
texttext22030152023StartStop three two onec1c2b1b2a1a2d1d2A double quote:#quot;A dec char:#9829;
2019-12-22 15:48:54
335
原创 VS2019远程开发配置
尝试一下win10远程linux开发,从而配置kaldi去调试。1 安装环境1.1 win10启用vs2019 linux1.2 centos安装相关库# centos sudo yum -y install gdb gdb-gdbserver zip openssh-server gcc gcc-g++# ubuntusudo apt-get install gdb gdbserver zip openssh-server g++2 新建项目2.1 创建C++ linux控制台项
2020-10-24 23:54:49
1165
原创 VS2019远程调试webrtcvad
文章目录1 准备代码2 新建vs工程到webrtcvad3 配置vs工程3.1 配置linux远程3.2 附加包含目录3.3 库依赖项3.4 调试页面4 遇到的问题4.1 error : unknown type name ‘int16_t’4.2 整个代码需要一个main函数之前在这VS2019单独编译WEBRTC VAD模块尝试通过用window上的vs2019调试过WEBRTC的VAD模块,但是其实还是很不方便,还需要将代码转到linux上进行使用。vs2019可以直接对linux代码进行编译和调
2020-10-24 23:48:38
453
原创 VS2019 Cmake
文章目录1 创建cmake项目2 开发测试2.1 切换CMake视图2.2 切换文件夹视图2.3 CMakeLists.txt2.4 win调试3 linux cmake调试3.1 解决cMake环境不一致问题3.2 配置项目cmake编译器和变量3.4 可编辑CMakeSettings.json修改生成路径[最好不要改]3.5 选择启动器开始调试3.6 调试文件不存在Reference1 创建cmake项目2 开发测试2.1 切换CMake视图2.2 切换文件夹视图【切换文件夹视图用于创
2020-10-24 23:48:04
1108
原创 中文TensorflowTTS在win10上理解一下
1 安装【环境要求】Python3.7 TensorFlow==2.3.0requirements = { "install": [ "tensorflow-gpu>=2.3.0", "tensorflow-addons>=0.10.0", "setuptools>=38.5.1", "librosa>=0.7.0", "soundfile>=0.10.2", "matp
2020-10-14 22:16:35
1857
1
原创 nnet3-chain-copy-egs用于chain模型输入数据
1 nnet3-chain-copy-egs划分数据集会将cegs.1.ark按照大小平均的划分为cegs.1.1.ark cegs.1.2.ark cegs.1.3.arknnet3-chain-copy-egs ark:cegs.1.ark ark:cegs.1.1.ark ark:cegs.1.2.ark ark:cegs.1.3.ark# 通过这种方式将数据集以txt形式拆分打开来看nnet3-chain-copy-egs ark:cegs.1.ark \ark,t:res/cegs.1
2020-10-13 20:06:42
589
原创 TensorFlow的一些trick
文章目录1 可查询站点2 安装2.1 TensorFlow 1.x2.2 TensorFlow 2.x2.3 TensorFlow的一些版本约束2.4 tensorboard3 备注3.1 TensorFlow 2.x后Keras和tf.keras选择问题4 简单总结4.1 TensorFlow1.x系列概念4.2 TensorFlow2.x系列概念5 TensorBoard使用技巧5.1 keras中使用5.2 TensorFlow保存loss和acc5.3 PyTorch使用TensorBoard6 V
2020-10-13 20:01:52
336
原创 keras简单使用bert
文章目录1 bert库1.1 bert4keras1.2 标准测试数据集1.3 bert权重列表2 keras版本2.1 下载各种权重2.2 标准测试exampleReference之前一直使用tf来使用bert,看着keras简单,闲来无事,玩玩。并且总结一下。把各种模型和权重的关系梳理一下。1 bert库1.1 bert4keraskeras-bert的githubbert4keras的github【特别注意】这里是在conda虚拟环境下操作的,请看Could not load dynami
2020-10-13 19:56:39
3235
原创 Could not load dynamic library cudart64_100.dll然用Anaconda3.7
使用环境:TensorFlow1.15.0 Keras2.3.1 cuda10.2 cudnn7.6.5.32在玩bert的时,报:Could not load dynamic library cudart64_100.dll经过查找,发现其实cuda10.2中包含了cudart64_100.dll的向下兼容。因此只需要将cudart64_100.dll的路径添加到环境变量中即可。...
2020-10-12 22:26:57
1078
1
原创 arm开发板挂载win10 nfsAxe NFS Server
之前在arm开发板挂载win10和ubuntu haneWIN NFS Server里说用HaneWIN搭建NFS Server,然后与开发板建立共享目录,方便访问。但是HaneWIN真心不好用,这里又遇到一个好工具。叫nfsAxe,很方便和win10建立共享1 下载和安装nfsAxe 3.6,一路next即可。2 启动NFS-Server第1次启动会弹出如下,点击是,用于配置共享目录3 配置共享目录确定,保存,win10的NFS配置即完成。4 开发板访问和arm开发板挂载win10和
2020-10-12 10:40:11
1066
2
原创 Kaldi的Python3库附加
为了更为方便观察Kaldi整个训练过程,需要将Kaldi写的Python3库附加到Python3的系统库中,方便定为和调试。1 wsj/s5/steps/libs目录该目录下的python文件均是kaldi训练chain和nnet3训练模型的主程序,通过这些python程序,带上合适参数,去调用shell的命令行(说是python,其实里面还是调用shell命令行去训练的)重点分析一下common.py里面的最常用的几个函数:【execute_command】前台运行一个shell命令行,若返回不
2020-10-09 11:18:53
1553
2
原创 PyTorch一些trick
1 可查询站点PyTorch中文教程 Apache PyTorch中文文档Pytorch Doc2 安装3 备注CPU上的所有张量(CharTensor除外)都支持与Numpy的相互转换。Torch张量和NumPy数组将共享它们的底层内存位置,因此当一个改变时,另外也会改变。评估模型时阻止grad属性计算:代码块包装在 with torch.no_grad()、requires_grad = Falsenn.Module中parameters()获取模型可学习参数...
2020-10-01 21:46:47
307
原创 SOX的一些命令和kaldi使用sox音频数据增强
如果喜欢FFMPEG命令,请看FFMPEG的一些命令批量操作音频文件参考5.1 批量输出绝对路径下的所有音频并更名1 SOX win10和linux安装yum install soxapt install soxsox win10下载地址和sox win10介绍配置环境变量C:\JAVA\sox-14.4.2-win32C:\JAVA\sox-14.4.2-win32;C:\ProgramFiles\cmake-3.7.0-win64-x64\bin;C:\JAVA\ffmpeg-20
2020-09-29 17:55:35
4748
2
原创 FFMPEG的一些命令
1 ffmpeg linux和win10 yum install ffmpeg ffmpeg-devel -y apt install ffmpegwin10的ffmpeg官网地址下载ffmpeg-20200504-5767a2e-win64-static.zip,然后直接解压即可,可以配置PATH环境变量值C:\JAVA\ffmpeg-20200504-5767a2e-win64-static\bin到PATH下,最好下载full版本ffmpeg -version2 ffmpeg命令2.1
2020-09-29 11:46:25
822
原创 linux断点调试的一些问题
linux断点调试的一些问题1 案例程序2 gdb2.1 安装方法2.2 gdb命令集2.3 gdb调试3 cgdb3.1 安装方法3.2 cgdb环境变量3.3 cgdb调试4 gdbgui4.1 安装方法4.2 gdbgui调试5 Emacs最强版5.1 安装方法5.2 配置~/.emacs5.3 配置后的快捷键5.4 .bashrc中增加5.5 emacs下的C开发Reference1 案例程序【demo.cpp】#include <stdio.h>long func(int a)
2020-09-26 14:20:15
1317
原创 Kaldi模型信息分析
1 调试方便准备在当前egs/s5目录下新建一个文件命名为path2.sh,内容比path.sh少最后一行export LC_ALL=C,用于避免数据乱码export KALDI_ROOT=`pwd`/../../..[ -f $KALDI_ROOT/tools/env.sh ] && . $KALDI_ROOT/tools/env.shexport PATH=$PWD/utils/:$KALDI_ROOT/tools/openfst/bin:$PWD:$PATH[ ! -f $K
2020-09-25 18:05:56
2239
原创 lattice-arc-post计算边上累计得分
1 模型预测产生lat.1.gz这里请参考理解lattice,这里有介绍解码过程中如何产生lattice内容文件,以及lattice内容分析。2 边上累计得分gunzip -c 20200921.lat.bin.gz |\lattice-arc-post --acoustic-scale=1.0 --print-alignment=true \exp/chain/tdnn_1a_sp/final.mdl ark:- -|\utils/int2sym.pl -f 5 data/lang_chain
2020-09-25 15:14:05
795
原创 pdb调试python
1 python输出异常信息window下python肯定很容易调试的,但是linux下就很难了,为了调试信息,可以输出抛出的异常看看具体什么错:try: ... ...except Exception as ex: print( "抛出异常 %s" % (ex) )2 pdb调试pythonpython3 -m pdb demo.py按照如上方式就可以使用pdb调试Python,在控制台断点调试,来解决不容易发现的错误。其实和gdb很类似。运行上面命令后,Pdb会自动停在第一行,等
2020-09-25 14:22:19
260
原创 lattice输出到<phone-id,后验概率>对齐到每帧
lattice输出到<transition-id,后验概率>对齐到每帧这介绍的是从lattice中输出到transition-id上的后验概率,对齐到每帧如果从lattice输出对齐到phone上的后验概率,要特别注意,从lattice中输出对齐到phone上的后验概率本身就是依赖于语言模型得到的,可看上面那篇文章有说原因1 模型预测产生lat.1.gz这里请参考理解lattice,这里有介绍解码过程中如何产生lattice内容文件,以及lattice内容分析。2 lattice输出<phon
2020-09-25 11:38:08
473
1
原创 lattice输出到<transition-id,后验概率>对齐到每帧
get_phone_post计算phone上概率并产生tacc和transform.mat这里介绍的是从声学模型计算到phone上的对齐每帧的后验概率计算chain声学模型帧对齐上的<pdf-id,后验概率>(不算语言模型)这里介绍的是从声学模型计算到pdf-id上的对齐到每帧的后验概率(做了部分max概率筛选,如125帧数x2[pdf-id 概率])nnet3-compute计算chain前向传播概率矩阵(声学模型输出)这里介绍的是从声学模型计算到pdf-id上的对齐每帧的后验概率矩阵(这里输出的是矩
2020-09-25 11:28:59
564
原创 Chrome浏览器网页保存为mhtml
1 配置Chrome浏览器Chrome浏览器要想保存为mhtml的话,以前是在chrome://flags下搜索mhtml然后点击启用即可但是新版本没有了这个功能,新版本是如下这么设置右键chrome的快捷方式,属性,选择目标,后面加上–save-page-as-mhtml2 保存mhtml方法重新打开chrome,打开一个网页,右键鼠标,另存为:选择mhtml即可...
2020-09-25 10:28:52
2526
原创 get_phone_post计算phone上概率并产生tacc和transform.mat
在1 通过get_phone_post.sh来计算phone上的后验概率. ./path.sh. ./cmd.sh# exp/chain/tri6_7d_tree_sp为chain模型训练时所有训练数据的对齐结果ali.*.gz# data/test_hires 为需要计算每一帧上phone概率的steps/nnet3/chain/get_phone_post.sh exp/chain/tri6_7d_tree_sp \exp/chain/tdnn_1a_sp data/lang data/t
2020-09-24 23:02:53
643
原创 声学模型计算到phone上后验概率和强制对其结果匹配
计算到phone上的后验概率logprob-to-post ark:exp/chain/nnet3_ali/xent.nnet3.1.ark ark:-|\post-to-phone-post --binary=false exp/chain/tdnn_1a_sp/final.mdl ark:- ark,t:-|head -n 5post-to-phone-post.cc or get_phone_post.sget_phone_post.shReferencesHow to get th
2020-09-24 22:08:26
1297
1
原创 计算chain声学模型帧对齐上的<pdf-id,后验概率>(不算语言模型)
通过这个nnet3-compute计算chain前向传播概率(声学模型输出)【2.3 output-xent输出】我们知道:通过nnet3-compute输出声学模型的输出值,他有两层节点,一个是output,一个是output-xent其实在训练目标函数(用交叉熵)时,用的是output-xent,但是output-xent的值非常大。因此要归一化,从而得到。在nnet3-compute计算chain前向传播概率(声学模型输出)【理解nnet3-compute的输出值】有讲到声学模型后验概率值的作用
2020-09-24 15:40:13
1006
原创 nnet3-compute计算chain前向传播概率矩阵(声学模型输出)
假设已经训练好了chain模型,想计算每一帧的pdf-id的前向概率,nnet3-compute可以帮助我们做到nnet3-compute在steps/nnet3/compute_output.sh脚本中有提到,还有nnet3-compute-batch呢1 准备数据和特征chain模型所需要的的特征是mfcc的hires特征(40维),这部分见chain模型音素对齐2 输出chain前向概率(声学模型输出)2.1 构建输出计算命令feats="ark,s,cs:apply-cmvn --nor
2020-09-24 13:37:46
1209
1
原创 GMM音素对齐
假设已经训练好了gmm模型,想用gmm模型对齐的话,这个对齐一定要有y哦有一个特别注意的地方是kaldi里面GMM对齐有两种:align_fmllr.sh(更高级) 和 align_si.sh可参考aishell1的训练脚本去训练fmllr特征的GMM模型,这里用align_fmllr.sh1 准备数据这里是参考 steps/align_fmllr.sh中的脚本,首先要的数据必须是<音频,分词的标注结果>,这里的数据准备其实和ASR数据准备一样。2 计算特征得到fests.scp.
2020-09-23 17:33:35
1518
原创 lattice对齐ctm到phone
之前是lattice预测对齐到词,经过理解,也是可以到phone(音素的),之前一直用这,这里做一个总结和笔记。其实就是lattice-align-phones的用法,到音素(phone)上的对齐lattice-push ark:"gunzip -c 20200921.lat.bin.prune.gz|" ark:-|\lattice-align-phones --replace-output-symbols=true exp/chain/tdnn_1a_sp/final.mdl ark:- ark:
2020-09-23 16:30:26
540
原创 lattice对齐ctm到词
在理解lattice之后,发现lattice也是可以做音频上的预测对齐的,这个比强制对齐工具好用多了,有时候的确需要用。因为不需要提供y,这里做一个笔记,其实很早之前就开始用了。其实就是lattice-align-words-lexicon和lattice-align-words的用法,到词(word)上的对齐和ali.gz一样,lattice其实也是可以对齐的,对齐到lexicon,由于在prepare_lang.sh时将position-dependent-phones设置为了false,因此,不能
2020-09-23 16:28:06
784
原创 montreal-forced-aligner(MFA)强制对齐用法
1 下载库和模型这里测试的是在Ubuntu 18.04.3 LTS下环境下(centos7.4环境证实不可行,需要源码安装编译,win10是可以的)。1.1 库和模型准备【1】下载汉语(mandarin)的预训练声学模型和g2p模型MontrealCorpusTools/mfa-models【2】下载linux库MontrealCorpusTools/Montreal-Forced-Aligner releases【3】下载发音词典mandarin-for-montreal-forced-ali
2020-09-23 16:16:50
4451
3
原创 Praat语音标注说明
1 下载Praat官网praat6121_win64.zip字体文件DoulosSIL-5.000.exe解压直接使用双击Praat.exe即可2 使用技巧2.1 首次打开Praat只要Praat Objects窗口,关闭Praat Picture窗口2.2 导入.wav音频或.TextGrid打开窗口后,可以选择多个wav音频或.TextGrid读入(按Ctr或Shift)2.3 标注初始化TextGrid文件2.4 同时选择wav和对应TextGrid标注按Ctr同时选择w
2020-09-23 16:09:06
11149
8
原创 chain模型音素对齐
假设已经训练好了chain模型,想用chain模型对齐的话(正常都是用GMM对齐)1 准备数据这里是参考 steps/nnet3/align.sh中的脚本,首先要的数据必须是<音频,分词的标注结果>,这里的数据准备其实和ASR数据准备一样。2 计算特征得到fests.scp. ./path.sh. ./cmd.shmfccdir=mfccsteps/make_mfcc.sh --cmd "$train_cmd" --nj 30 data/test exp/make_mfcc/te
2020-09-22 17:52:40
1099
原创 理解lattice
1 lattice和ali.gz区别【产生的lattice文件】 是ASR转写的候选结果路径的存储(简单理解就是ASR转写的候选结果),将所有候选路径都存在了这个lattice中,就可以在这个候选结果中去挑选最佳的候选结果(即one best路径)。不需要提供y,不需要标注结果,只需要模型。【产生的ali.gz】是 GMM-HMM产生的(具体命令是gmm-align-compiled steps/align.sh 或 nnet3-align-compiled steps/nnet3/align.sh),
2020-09-22 16:11:42
1052
原创 Python的virtualenv虚拟环境
Python的virtualenv虚拟环境1 安装虚拟环境1.1 创建虚拟环境1.2 激活虚拟环境1.3 退出虚拟环境1.4 删除虚拟环境2 使用虚拟环境其实一直在Python的虚拟环境,确实很好用,这次想总结一下,好方便自己查找,有时候对某一个库版本要求不一样,用虚拟环境就不用重新安装一个Python库。一直用的是纯Python3.7,在纯Python3.7上面安装虚拟环境。1 安装虚拟环境pip3 install virtualenv【虚拟环境是紧跟在一个目录下,并创建一个虚拟环境名字,所有的
2020-09-18 17:38:07
2601
原创 NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver.
NVIDIA-SMI has failed because it couldn't communicate with the NVIDIA driver.1 centos遇到解决办法2 ubuntu遇到解决办法2.1 卸载一切2.2 下载cuda和cudnn2.3 安装驱动2.3 安装cuda2.4 安装cudnn2.5 配置环境变量blogdocker等系统操作遇到的问题ubuntu20.04[centos7、win类似]记录1 centos遇到解决办法之前centos遇
2020-09-18 14:23:48
534
原创 kaldi安装SRILM语言模型库
ngram-count是SRILM语言模型库的一个命令,需要使用ngram-count的话,就必须安装SRILM库,在kaldi里安装这个库较为麻烦,这里做一个笔记。1 下载SRILM库看到网上很多介绍说去http://www.speech.sri.com/projects/srilm/download.html下载,但是根本访问不了,都有放弃安装的念头。遇到一个朋友,他跟我说BitSpeech/SRILMclone的。记得下载1.7.2的,1.7.3的我试了不管用。下载后请解压并更改文件夹命名为sr
2020-09-16 17:07:10
1929
原创 一些语音awk命令解释日志
1 awk -v命令解析text=data/local/train/textlexicon=data/local/dict/lexicon.txtdir=data/local/lmmkdir -p $dircleantext=$dir/text.no_oovcat $text | awk -v lex=$lexicon 'BEGIN{while((getline<lex) >0){ seen[$1]=1; } } {for(n=1; n<=NF;n++) { if (se
2020-09-16 14:03:17
500
原创 samba让centos共享目录给win10
1 安装sambayum -y install samba samba-client samba-common2 关闭防火墙或防火墙允许samba# 防火墙允许samba服务firewall-cmd --permanent --add-service=sambafirewall-cmd --reload# 或关闭防火墙vim /etc/selinux/config #永久关闭selinuxset SELINUX=disabled #SELINUX=enforcing改为SELIN
2020-09-14 09:57:20
345
原创 NLP中的Embedding总结
NLP中的Embedding1 榜单1 榜单可以从这里看到从2013年到现在所有的语言模型文章。这里先列表格总结,历史为什么这么走。模型思想缺点word2vecCBOW(上下文词预测当前词),Skip-gram(当前词预测上下文词)无法区分多义词的不同语义同一个单词占的是同一行的参数空间ELMO...
2020-09-02 15:49:09
1224
4.dwr框架Ajax学习haozl整理(非常全的了更新到2013.8.17)
2013-08-27
JSP开发javaWeb全程所有非常全的总结 第1版
2013-08-06
linux文件间传参最佳方式demo.zip
2020-01-12
HttpClientUtil.java
2019-12-22
哈工大ltp linux下编译好的whl文件直接可安装
2018-07-13
PYTHON系统环境变量PYTHON_HOME脚本修改程序
2016-12-05
搜狗鼠标手势1.0.0.410
2016-07-05
myeclipse2015 Stable2.0激活最新激活步骤
2015-11-24
ZendDebugger for PHP5.5 and PHP5.6 VC11版本
2015-06-16
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人