- 博客(101)
- 资源 (36)
- 收藏
- 关注

原创 感悟
你可以把每一天当做最后一天在过!活出你的激情来!拿出魄力来!每天不断鞭策自己做的更好!人生的最后一章尚未写下,昨日种种的事情并不重要,你发生了什么也没关系。重要的是,你要怎么做?
2017-01-04 13:47:07
344
原创 valgrind 检测内存泄漏
1. 简介 Valgrind是一款用于内存调试、内存泄漏检测以及性能分析的软件开发工具。 Valgrind遵守GNU通用公共许可证条款,是一款自由软件。 到3.3.0版本为止,Valgrind支持x86、x86-64以及PowerPC上的Linux。除此之外,还有一些其它非正式支持的类Unix平台(如FreeBSD、NetBSD以及Mac OS X)。...
2019-10-31 14:18:20
644
原创 01. KNN 算法详解
kNN算法的核心思想是如果一个样本在特征空间中的k个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。 kNN方法在类别决策时,只与极少量的相邻样本有关。由于kNN方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所...
2019-03-07 17:33:33
1896
原创 Conda 虚拟环境创建
Conda是一个开放源码包管理系统和环境管理系统,用于安装多个版本的软件包及其依赖关系(比如科学计算环境要求多个Python版本并存,尤其是2.x和3.x的并存。这个通过 virtualenv 可以做到。Anaconda也正是通过其实现的),并在它们之间轻松切换。它适用于Linux,OS X和Windows,并且是为Python程序创建的,但可以打包和分发任何软件。Conda包括Anaconda和...
2018-05-27 14:18:01
16774
1
转载 两台服务器之间拷贝文件-scp方法
两台服务器之间拷贝文件-scp方法 使用实例:sup -r /mnt/yilinli_api root@***.**.**.**:/mnt/LL_api1不同的Linux之间copy文件通常有4种方法 1.ftp 2.samba服务 3.sftp 4.scp以上前三种方法,都比较繁琐,这里不赘述。最简单的方法就是scp,可以理解为ssh管道下的cp命令。把当前一个文件copy到远程服务器上:scp...
2018-05-15 11:49:49
7065
原创 生成语言模型
这里主要介绍我使用过的两种根据文本生成语言模型的两种方法1. 通过网站: Sphinx 上传文件,生成对应的语言模型,需要注意的是文件最好不要太大,网站容易报504错误,贴下图吧,傻瓜式的操作方式:2. 使用SRILM 训练语言模型SRILM基本使用方法1、从语料库中生成n-gram计数文件:1ngram-count -text train.txt -order 3 -write train.t...
2018-05-11 10:17:09
4008
原创 python 日志模块封装
封装:#-*- coding: UTF-8 -*- import logging.handlersclass Logger(logging.Logger): def __init__(self, filename=None): super(Logger, self).__init__(self) # 日志文件名 if filenam...
2018-05-03 16:01:53
4053
原创 boost1.66.0 库编译报错,找不到 pyconfig.h
/boost/python/detail/wrap_python.hpp:50:23: fatal error: pyconfig.h No such file or directory原因为boost的原生错误,需要修改安装脚本python.jam1.65.1的位置在/boost_1_65_1/tools/build/src/tools/python.jam的547行,改为...
2018-05-02 10:56:24
4995
1
转载 Python + C/C++ 嵌入式编程 (基础)
Python 提供了丰富的 C API 函数,我们使用这些 C API 函数可以实现将 Python 文件中的函数、类等在 C/C++ 文件中进行调用,从而使得我们可以方便地使用 Python 代码来帮助我们实现一些额外的需求(如:嵌入神经网络模型)。网上已经有很多介绍如何将 Python 嵌入到 C/C++ 的博客,这里不再累述。这里主要叙述一下如何实现多维数组在 Python 文件和 C/C+...
2018-04-16 16:48:31
2053
1
原创 python封装 (pyinstaller)
windows 下编写控制台程序后,会生成exe的可执行程序,创建工程最后都会生成可执行程序,python工程都是python调用各种模块,执行起来也不方便,所以这里讲一下python封装exe文件过程!windows 系统(按照我自己环境): 首先我们拿到python工程文件后,必须保证程序可以正常执行,才能在此环境中进行封装,不然封装成功了,执行时会报错,提示有些模块没有导入 ...
2018-03-19 18:16:46
14059
1
原创 ubuntu 安装 scikit-learn
Scikit-learn 要求:Python (>= 2.7 or >= 3.3),NumPy (>= 1.8.2),SciPy (>= 0.13.3).安装scikit-learn需要先安装许多的依赖包,scikit-learn它是一个开源的机器学习模块,它是建立在NumPy,Scipy和matplotlib模块上的,scikit-learn的特点是分类器、回归、聚类、向...
2018-03-15 09:26:07
2663
原创 语音合成(Amazon 接口)
Amazon Polly 文本转语音 (python实现)网页版的长这个样子,需要自己手动输入,比较麻烦,我们希望通过python和一些文件自动合成语音首先需要去官网注册账户,这里有一年的免费体验,注册账户需要信用卡绑定!注册完账号后,需要配置AWS CLI , 它是一个命令行的接口,具体参考AWS CLI使用 Pip 安装 AWS CLI使用 pip 安装 AWS CLI。$ pip in...
2018-03-14 14:50:12
2799
1
原创 Docker+Uwsgi+nginx+flask
最近一直在忙着公司项目,学习服务器开发时间不长,希望可以记录点东西,如果写的错误,不好的请指正 项目中用python+swagger 基本完成了后台服务器的接口开发,但是需要将程序部署到其他服务器上,因此用到了docker简介 Web应用随时可能被攻击者利用来夺取整个主机的权限,这是很常见也是很恐怖的一件事。为了更高的安全性,就需要将不同应用之间进行隔离(尤其是在这些应...
2018-03-08 14:44:42
8633
转载 语音识别-特征提取 (二)
下面总结的是第四个知识点:MFCC。因为花的时间不多,所以可能会有不少说的不妥的地方,还望大家指正。谢谢。 在任意一个Automatic speech recognition 系统中,第一步就是提取特征。换句话说,我们需要把音频信号中具有辨识性的成分提取出来,然后把其他的乱七八糟的信息扔掉,例如背景噪声啊,情绪啊等等。 搞清语音是怎么产生的对于
2018-01-26 10:55:18
8573
转载 语音识别-特征提取 (一)
一.语音的产生简介1.1 发音器官 人体的语音是由人体的发音器官在大脑的控制下做生理运动产生的。人体发音器官由三部分组成:肺和气管、喉、声道。 肺是语音产生的能源所在。气管连接着肺和喉,是肺与声道的联系通道。喉是由一个软骨和肌肉组成的复杂系统,其中包含着重要的发音器官——声带。声带为产生语音提供主要的激励源。声道是指声门(喉)至嘴唇的所有发音器官,包括咽喉、口腔和鼻腔。
2018-01-26 10:53:06
24316
3
原创 Kaldi DNN的特征提取和解码的连接操作
通过读脚本,我们知道了对应的特征提取和dnn的解码过程,得到一个lat(晶格文件),最后通过晶格文件进行分析,得到解码的结果,通过几次尝试,我这里通过wav文件得到了解码的文件,接下来将详细说明:首先是创建独立的文件夹,专门用来测试,里面保存5个文件,分别是:1. t2ss.wav(原始的wav文件) 2. wav.scp(里面是保存了wav的绝对路径) 3. fina
2017-11-16 11:03:55
3606
2
原创 Kaldi 文件打印及其说明
kaldi做文件分析时,需要使用命令调用可执行程序打印文件结构,下面对几种常见的文件做一下说明 1.words.txt 文件和 phones.txt文件(这是数据准备的prepare_lang.sh脚本生成)里面的格式是openfst格式对应的是词 和整数的映射接下来看一下phone文件夹,里面有三种格式 csl int txt ,其实内容都是一样的, 从上
2017-11-03 16:45:24
3657
原创 Ubuntu 添加管理员
用 ubuntu14.04 发现只有客户和游客模式,默认管理员是保护起来了,网上找到的一些修改的方法也是挺坑爹的,这里给出一个解决方案:首先这个登陆后不要是游客模式,游客模式不能使用sudo命令1. sudo passwd root设置root的密码: 2.使用su root来测试是否可以进入root用户,如果出现#说明已经设置root
2017-11-02 09:46:48
1600
原创 论文下载
快速检索http://scholar.lib.vt.edu/theses/etd-search.html按作者名检索http://scholar.lib.vt.edu/theses/browse/by_author/按系(专业)检索http://scholar.lib.vt.edu/theses/browse/by_department一个国外图书馆网址,San
2017-11-01 10:58:00
804
转载 Timit 脚本理解
数据准备 local/timit_data_prep.sh生成的内容放在data/local/data中。对于train、test和dev,分别生成相应的_sph.flist、_sph.scp、.uttids、.trans、.text、_wav.scp、.utt2spk、.spk2utt、.spk2gender、.stm和.glm文件。NOTE:.wav files a
2017-10-27 17:39:02
1345
原创 Kaldi 查看不同文件用到的命令
* 1. ark,scp文件~/kaldi/src/featbin/copy-feats ark:raw_mfcc_dev.10.ark ark,t:-|headark存的试二进制文件,scp可以直接用cat命令看。* 2. fst文件~/kaldi/tools/openfst-1.6.2/bin/fstprint L.fst | head -n 10
2017-10-26 17:30:09
6282
转载 Kaldi在Window上的安装
文章转载地址: 转载地址本文在Kaldi已有的Windows VS工程及其编译流程说明的基础上,更新有问题的子模块,并添加对VS工程的适配代码,确保Kaldi VS工程在windows平台上编译通过及online-wave-gmm-decode-faster 解码程序的正常运行。Note:1) 本文撰写时间为:2017.Oct.17, 相关代码的版本以此时间点为基准。
2017-10-26 17:27:37
8506
2
原创 机器学习笔记八 - SVM(Support Vector Machine,支持向量机)的剩余部分。即核技法、软间隔分类器、对SVM求解的序列最小化算法以及SVM的一些应用
本篇对应斯坦福公开课的第8个视频,主要讲述了SVM(Support Vector Machine,支持向量机)的剩余部分。即核技法(Kernels)、软间隔分类器(softmargin classifier)、对SVM求解的序列最小化算法(Sequential Minimal Optimization,SMO)以及SVM的一些应用。另外,由于笔记6-8大部分都是SVM的内容,因而打包上传到
2017-10-25 10:25:03
416
原创 Kaldi在虚拟机里面安装
虚拟机: Ubuntu 14.04 Ubuntu下载地址 gcc 建议安装4.8以上版本 ,登陆最好是root, 废话不多说,开始,首先安装虚拟机, 虚拟机安装 , 完成的示意图,快捷键Ctrl+Alt+t打开终端:在终端中键入sudoapt-get update 命令然后输入密码 回车kaldi项目现在托管在github上,需要使用g
2017-10-25 09:31:00
2813
原创 机器学习笔记七 - 最优间隔分类器、原始/对偶问题、svm的对偶问题
本篇笔记针对ML公开课的第七个视频,主要内容包括最优间隔分类器(Optimal Margin Classifier)、原始/对偶问题(Primal/Dual Problem)、svm的对偶问题,都是svm(support vector machine,支持向量机)的内容。
2017-10-12 17:42:11
329
原创 机器学习笔记六 - 朴素贝叶斯的多项式事件模型、神经网络、支持向量机的函数间隔与几何间隔
本篇笔记针对斯坦福ML公开课的第6个视频,主要内容包括朴素贝叶斯的多项式事件模型(MultivariateBernoulli Event Model)、神经网络(Neural Network)、支持向量机(Support Vector Machine)的函数间隔(functionalmargin)与几何间隔(geometricmargin)。
2017-10-10 19:46:54
409
原创 机器学习笔记五 - 生成学习算法、高斯判别分析、朴素贝叶斯、拉普拉斯平滑
本篇博客为斯坦福ML公开课第五个视频的笔记,主要内容包括生成学习算法(generate learning algorithm)、高斯判别分析(Gaussian DiscriminantAnalysis,GDA)、朴素贝叶斯(Navie Bayes)、拉普拉斯平滑(Laplace Smoothing)
2017-09-29 11:27:52
509
原创 机器学习笔记四 - 牛顿方法、指数分布族、广义线性模型、广义线性模型(多项式分布)
第4个视频的笔记如下,主要的内容包括牛顿方法、指数分布族、广义线性模型、广义线性模型举例之多项式分布
2017-09-28 19:43:47
491
原创 机器学习笔记三 - 局部加权回归、最小二乘的概率解释、逻辑斯蒂回归、感知器算法
第3个视频的笔记如下,主要的内容包括局部加权回归、最小二乘的概率解释、逻辑斯蒂回归、感知器算法
2017-09-28 14:40:02
448
原创 机器学习笔记一二 - 线性规划 梯度下降 正规方程
第1-2个视频的笔记如下,主要的内容包括线性规划、最小二乘法,求解最小二乘法的梯度下降算法与正规方程组算法。这里的公式一定要自己亲自证明一遍,这样才能加深印象,虽然花的时间比较多,实际会为接下来的深入学习剩下时间!
2017-09-28 10:11:11
1301
原创 新的方向
换到一家新公司后,学习方向完全改变了,原来是做C++(前端吧),现在要开始学习Linux和Kaldi了,同时还是要学习shell和python,机器学习和深度学习,可能也要学习统计,总之,这次的工作方向会是很有意思的,也是需要自己多下功夫来学习的,这里博客也将记录一些别的优秀的笔记文档和和自己对这些的一些理解和看法,算是一个记录自己的成长吧! 加油吧,骚年!
2017-09-26 08:57:10
351
转载 机器学习笔记 (一) 监督学习、无监督学习
监督学习(Supervised Learning)在监督学习中,给定一组数据,我们知道正确的输出结果应该是什么样子,并且知道在输入和输出之间有着一个特定的关系。这么说可能理解起来不是很清晰,没关系,后面有具体的例子。监督学习的分类监督学习可分为“回归”和“分类”问题。监督学习分类在回归问题中,我们会预测一个连续值。也就是说我们试图将输入变量和输出用一个连
2017-09-19 14:40:56
21438
转载 UE破解版安装
UltraEdit64位破解版下载 :http://download.youkuaiyun.com/download/hq354974212/9799445激活前:必须断网激活步骤:(以下图片没有正常显示,请点击进去,就可以看见)1.打开UltraEdit,出现如下图2.点击Activate,出现如下图3.点击Of
2017-09-18 13:48:43
9440
1
原创 字符串和编码(ASCII 、Unicode、UTF-8)
计算机只能处理数字,如果要处理文本,就必须先把文本转换为数字才能处理。最早的计算机在设计时采用8个比特(bit)作为一个字节(byte),所以,一个字节能表示的最大的整数就是255(二进制11111111=十进制255),如果要表示更大的整数,就必须用更多的字节。比如两个字节可以表示的最大整数是65535,4个字节可以表示的最大整数是4294967295。计算机是美国人发明的,因此,最早只有1
2017-07-19 15:02:36
3714
原创 SourceTree 免注册
最近忙着公司项目,用到了git,客户端使用sourcetree来管理代码,老版本的source用起来卡,所以下载了新版本sourcetree,截图一下这里在下载安装sourcetree到简单,但是安装打开后会提示你Atlassian需要注册,这家软件公司在澳大利亚,所以注册时需要翻墙,才能注册成功,为了快点使用,这里提供一个方法1. 找到目录: C:\Users\用户\Ap
2017-06-13 11:15:18
34745
4
原创 HTTP(GET和POST访问URL) -- wininet
string CNet::GetUrlHost(string strUrl){ string strRtn; if(strUrl.empty()) return ""; int length = strUrl.length(); int i=0; int j=0; for(;i<length;i++) { if(strUrl.at(i) == '/') {
2017-03-21 09:44:56
2517
原创 HTTP -- KeepAlive
1、什么是Keep-Alive模式?我们知道HTTP协议采用“请求-应答”模式,当使用普通模式,即非KeepAlive模式时,每个请求/应答客户和服务器都要新建一个连接,完成 之后立即断开连接(HTTP协议为无连接的协议);当使用Keep-Alive模式(又称持久连接、连接重用)时,Keep-Alive功能使客户端到服 务器端的连接持续有效,当出现对服务器的后继请求时,Keep-Alive功能...
2017-03-20 11:38:19
411
原创 TCP/IP -- 物理层
物理层是TCP/IP 网络模型的第一层,它虽然处于最底层,却是整个通信系统的基础, 正如高速公路和街道是汽车通行的基础一样。理层为设备之间的数据通信提供传输媒体及 互连设备,为数据传输提供可靠的环境。目录物理层功能 物理层关心的内容 物理层基本传输与多址方式 WiMAX物理层关键技术及其演进物理层功能 物理层的功能首要功能就是为数据端设备提供传送数据的通路。其次,物理层...
2017-02-24 10:34:24
4259
libcurl+openssl 下载文件
2016-10-11
QQMusicEx(Duilib 制作QQ音乐的界面)
2016-10-09
Wireshark 抓包工具
2016-08-01
SpeechRecognitionAlgorithmsUsingWeightedFinite-StateTransducer
2019-03-21
隐马尔科夫在语音处理中的应用 英文版
2018-01-16
SPEECH RECOGNITION WITH WEIGHTED FINITE-STATE TRANSDUCERS (WFST))
2017-11-10
OpenGL超级宝典配置文件
2017-02-08
九大行星自传公转 - OpenGL
2017-01-16
Windows网络编程技术
2016-10-31
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人