
语音识别
文章平均质量分 75
小排_611
生如夏花
展开
-
语音基础知识
语音识别原理:语音识别的最终目的是让机器听懂人的语言。语音信号通过麦克风采集,经过采样和 A/D 转换后由模拟信号转变为数字信号。然后对语音的数字信号进行预加重,分帧,加窗,端点检测和滤波等处理。预处理过后的语音信号将按照特定的特征提取方法 取出最能够表现这段语 音信号特征的参数,这些特征参数按时间序列构成了这段语音信号的特征原创 2017-07-14 18:29:31 · 679 阅读 · 0 评论 -
自然语言处理(一)
概论自然语言处理----利用计算机处理文本及声音。应用领域:输入—输出;输入法; 拼写更正;机器翻译;evernote推荐系统; 英文写作助手;twitter重大事件分析;医疗诊断;体育赛事报道生成;应用技术:语言模型,自动机,中文分词,文本对齐,模板匹配,分类器,相似度计算,local sensitive hashing,文本分类,关键词匹配,原创 2017-07-14 18:33:23 · 1932 阅读 · 0 评论 -
ASR---自动语音识别 概述
语音识别基本原理:观察矢量X=X1X2…Xn词序列W=W1W2…Wm 最优词序列W^ P(X|W): 声学模型描述了词W产生的情况下信号X的概率。P(W): 语言模型描述了词W出现的频率概率分布P(X|W)和P(W)被假设成某种已知的概率分布函数Pa(X|W)和Pb(W):概率分布函数中的参数集a和b通过统计学的方法从实际训练数据中估计得到原创 2017-08-19 18:31:50 · 2232 阅读 · 0 评论 -
声学模型训练----Acoustic Modeling
General Framework for AM:Building ASR system incrementallyContext-independent ➔ Context-dependent modelingMono-phone ➔ Tri-phone HMMSingle Gaussian mixture per state ➔ Multiple Gaussian mixtur原创 2017-08-19 18:45:07 · 1211 阅读 · 0 评论 -
CrossWord of AM training
General Framework for Acoustic ModelingBuilding ASR system incrementallyContext-independent ➔ Context-dependent modelingMono-phone ➔ Tri-phone HMMSingle Gaussian mixture per state ➔原创 2017-08-19 19:44:07 · 343 阅读 · 0 评论 -
自然语言处理(二)
神经序列模型:机器学习:优化目标函数:初始化参数计算偏导数更新参数更新learning rate,直至收敛Batch Gradient Descent 梯度下降法:稳定可靠,更新速度慢。必须遍历所有的训练数据求偏导数,才能更新一次参数。Stochastic Gra原创 2017-07-14 18:35:22 · 394 阅读 · 0 评论