- 博客(14)
- 资源 (2)
- 收藏
- 关注
原创 transformer源码解析和原理解析
Attention is all you need源代码解析和相关数据问题。解析原链接:https://zhuanlan.zhihu.com/p/71973786源码链接:https://github.com/jadore801120/attention-is-all-you-need-pytorch论文链接:https://arxiv.org/pdf/1706.03762v4.pdf...
2021-01-25 22:52:33
348
原创 utf-8编码范围 unicode的关系
网上一般给出的编码范围:UTF-8 (Unicode)u4e00-u9fa5 (中文)x3130-x318F (韩文)xAC00-xD7A3 (韩文)u0800-u4e00 (日文)实际上发现:除了u4e00-u9fa5 (中文)之外,还有(0x3400, 0x4DB5,0x358F)也是。GB18030在GB13000.1的20902个汉字的基础上增加了CJK扩展A的6582...
2020-04-29 09:44:39
806
原创 多个txt文件合并并排序
实用小技巧-----将多个txt文件合并为一个(windows系统)转载PZ~浪味仙 最后发布于2019-03-14 10:09:47 阅读数 2383 收藏展开仅需2步1、cd 至目标文件夹,即你需要将所有想要合并的txt文件添加至目标文件夹中;2、执行如下命令 type *.txt > C:\目标路径\合并后的文件名.txt...
2020-04-27 14:51:10
1094
原创 kaldi 强制对齐相关代码介绍
Corpus Phonetics TutorialEleanor ChodroffIntro Penn Forced Aligner AutoVOT Kaldi Other ResourcesPrerequisites Familiarization Training Acoustic Models Conceptually ...
2020-04-08 09:50:26
1281
转载 深度学习方面126片博文 内容包括图像处理,语音识别,机器学习,自然语言处理等。
一、ImageNet Evolution以下五篇论文是深度学习的破冰著作,见证了卷积神经网络越来越深,效果越来越好,其中ResNet更是在原始网络结构上有了新的突破~~[Nature15] Deep Learning:摘自Yann LeCun和Youshua Bengio以及Geoffrey Hinton三人合著发表在nature2015的论文[NeurIPS12] ImageNet Cla...
2020-04-07 13:45:42
960
原创 2019google 语音活性检测VAD论文
https://blog.youkuaiyun.com/qq_30262201/article/details/102653652
2020-03-21 14:23:53
484
原创 数据扩展方法(待续)
数据扩展方法(待续)时频遮盖滤波滤波的处理举例:from scipy import signalsample_freq = 16000freq_threshold = [600 * 2 / sample_freq, 2800 * 2 / sample_freq]hipass_filter = signal.butter(8, freq_threshold[0], ‘highpass’...
2019-10-18 14:00:11
213
转载 kaldi内存泄漏排查
原文http://bindog.github.io/blog/2019/08/05/kaldi-memory-leak/经过一番搜索,在Linux下常用的内存泄露检查工具箱是valgrind,这是一个非常强大的工具,光说明使用手册就有400多页。比较傻瓜的使用方式是直接使用valgrind下面的memcheck工具,当然这个工具并不是万能的,在Kaldi这种比较复杂庞大的工程下面,想要定位出问...
2019-10-12 15:11:43
299
转载 【伪科学争议】谷歌研究员两万字批驳上交大用深度学习推断犯罪分子
本文转自:https://blog.ailemon.me/2017/05/08/physiognomys-new-clothes/不久前, 上海交通大学的两位研究者发布了一项题为“利用脸部照片自动推断犯罪性”的研究,利用基于有监督的机器学习的方法,根据人的脸部特征预测一个人是否有犯罪倾向,“准确率接近90%”。该研究在国内外引起了广泛的争议。近日,谷歌的几名研究员撰文对这一研究进行了批驳,回顾了...
2019-10-11 14:32:19
674
原创 ASR欠拟合解决办法
在这里插入代码片@TOC语音识别模型欠拟合解决办法草稿:1减少dropout层数,增加输入特征维度或分辨率,增加模型规模,减少输出类别数。PS:分辨率:分辨率比如频谱的时间移动,mei刻度粗细。...
2019-09-27 14:03:41
236
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人