南森阳杉-优快云博客

原创 docker创建容器挂载宿主机文件、远程访问

docker 宿主机文件挂载，容器远程外部SSH访问

2022-06-28 15:58:10 1111

原创 transformer源码解析和原理解析

Attention is all you need源代码解析和相关数据问题。解析原链接：https://zhuanlan.zhihu.com/p/71973786源码链接：https://github.com/jadore801120/attention-is-all-you-need-pytorch论文链接：https://arxiv.org/pdf/1706.03762v4.pdf...

2021-01-25 22:52:33 348

原创 utf-8编码范围 unicode的关系

网上一般给出的编码范围：UTF-8 (Unicode)u4e00-u9fa5 (中文)x3130-x318F (韩文)xAC00-xD7A3 (韩文)u0800-u4e00 (日文)实际上发现：除了u4e00-u9fa5 (中文)之外，还有(0x3400, 0x4DB5，0x358F)也是。GB18030在GB13000.1的20902个汉字的基础上增加了CJK扩展A的6582...

2020-04-29 09:44:39 806

原创多个txt文件合并并排序

实用小技巧-----将多个txt文件合并为一个（windows系统)转载PZ~浪味仙最后发布于2019-03-14 10:09:47 阅读数 2383 收藏展开仅需2步1、cd 至目标文件夹，即你需要将所有想要合并的txt文件添加至目标文件夹中；2、执行如下命令 type *.txt > C:\目标路径\合并后的文件名.txt...

2020-04-27 14:51:10 1094

原创 kaldi 强制对齐相关代码介绍

Corpus Phonetics TutorialEleanor ChodroffIntro Penn Forced Aligner AutoVOT Kaldi Other ResourcesPrerequisites Familiarization Training Acoustic Models Conceptually ...

2020-04-08 09:50:26 1281

原创 GMM-HMM CTC对齐方式选讲

https://www.bilibili.com/video/BV1KA411b7Q9/

2020-04-07 13:48:34 758

转载深度学习方面126片博文内容包括图像处理，语音识别，机器学习，自然语言处理等。

一、ImageNet Evolution以下五篇论文是深度学习的破冰著作，见证了卷积神经网络越来越深，效果越来越好，其中ResNet更是在原始网络结构上有了新的突破~~[Nature15] Deep Learning：摘自Yann LeCun和Youshua Bengio以及Geoffrey Hinton三人合著发表在nature2015的论文[NeurIPS12] ImageNet Cla...

2020-04-07 13:45:42 960

原创 2019google 语音活性检测VAD论文

https://blog.youkuaiyun.com/qq_30262201/article/details/102653652

2020-03-21 14:23:53 484

原创数据扩展方法（待续）

数据扩展方法（待续）时频遮盖滤波滤波的处理举例:from scipy import signalsample_freq = 16000freq_threshold = [600 * 2 / sample_freq, 2800 * 2 / sample_freq]hipass_filter = signal.butter(8, freq_threshold[0], ‘highpass’...

2019-10-18 14:00:11 213

转载 kaldi内存泄漏排查

原文http://bindog.github.io/blog/2019/08/05/kaldi-memory-leak/经过一番搜索，在Linux下常用的内存泄露检查工具箱是valgrind，这是一个非常强大的工具，光说明使用手册就有400多页。比较傻瓜的使用方式是直接使用valgrind下面的memcheck工具，当然这个工具并不是万能的，在Kaldi这种比较复杂庞大的工程下面，想要定位出问...

2019-10-12 15:11:43 299

转载【伪科学争议】谷歌研究员两万字批驳上交大用深度学习推断犯罪分子

本文转自：https://blog.ailemon.me/2017/05/08/physiognomys-new-clothes/不久前，上海交通大学的两位研究者发布了一项题为“利用脸部照片自动推断犯罪性”的研究，利用基于有监督的机器学习的方法，根据人的脸部特征预测一个人是否有犯罪倾向，“准确率接近90%”。该研究在国内外引起了广泛的争议。近日，谷歌的几名研究员撰文对这一研究进行了批驳，回顾了...

2019-10-11 14:32:19 674

原创搜喵pinyin输入法校准拼音输入

搜喵输入法：https://github.com/crownpku/Somiao-Pinyin

2019-09-30 15:06:19 478

原创 ASR欠拟合解决办法

在这里插入代码片@TOC语音识别模型欠拟合解决办法草稿：1减少dropout层数，增加输入特征维度或分辨率，增加模型规模，减少输出类别数。PS:分辨率：分辨率比如频谱的时间移动，mei刻度粗细。...

2019-09-27 14:03:41 236

dlx59140096的博客