算法纲目


很多时候需要去整理各种算法,想把自己学习到的算法形成一个较为完整的知识体系,有组织,有系统,有明目的去研究和学习,一般:

算法原理Paper拆解
训练集数据量
测试集业务场景覆盖度
性能
参数调优
工程化

1 外链系列


1.0 每日必逛街

Paper With Code
athena【里面有各种特征提取很多语音基础都已经实现】
wer_are_we.md
kaldi【语音鼻祖】
搜狗C++服务器引擎
追一的苏剑林-信息时代频道
追一的苏剑林-让Keras更酷一些
arxiv seach
B站直观数学之美
Awesome-PyTorch汉化版
深度学习画图组件PPT
高效处理文本数据神器textHero


1.2 前沿外链

State-of-the-Art Trending Research
语音方向Trending Research
Awesome-Speech-Recognition-Speech-Synthesis-Papers
AI最新会议截止
International Conferences
语音识别基本法

LeetCode动画
LeetCode刷题指导
AI 算法工程师手册
动手学习深度学习
刘建平Pinard-机器学习博客
寒小阳、龙心尘、手把手学习机器学习与数据挖掘
码农场Hanlp作者
同事夏博客
语音合成大神Leo Ma的GitHub
NLP大神begeekmyfriend的GitHub
★★C++那些事(各种教程工具)

PyTorch中文w3c教程
★ApachePyTorch中文文档
Pytorch Doc

Tensorflow中文w3c教程 TensorFlow官方文档


1.3 前言仓库

超轻量级中文ocr https://github.com/ouyanghuiyu/chineseocr_lite
中文ocr https://github.com/chineseocr/chineseocr
C/C++ 技术面试基础知识总结 https://github.com/huihut/interview


1.4 实用工具

toolwa Github Add Speed download code
Github代下载
ocam录屏工具
红蜻蜓截图工具
ShareX截图录屏工具
listary window10快速搜索

2 博客系列


2.0 问题系列

kaldi遇到的问题
python科学计算遇到的问题
C++或C下统计耗时常用语法
docker等系统操作遇到的问题
photoshop图片添加边框
Chrome浏览器网页保存为mhtml


2.1 工程trick

linux各种命令手册
markdown支持的latex
markdown技巧
ubuntu20.04【centos7、win类似】记录
NVIDIA-SMI has failed because it couldn‘t communicate with the NVIDIA driver.
samba让centos共享目录给win10

linux断点调试的一些问题
GDB调试的一些技巧
CMake跨平台交叉编译
git产生私钥和公钥再转ppk
linux下用Makfile多目标编译-用作以后提取
linux下用Makefile编译代码通用模板-用作以后提取
Makefile中的for循环
C++C递归删除文件夹
C++C IO操作帮助函数
C++C正则表达式帮助函数
C++C日志帮助和统计耗时
C++和C下时间格式化如YYYYMMDD HH:mm:mm.fff支持win和Linux
C++C递归删除文件夹
VS下fatal error LNK1169: 找到一个或多个多重定义的符号,Linux正常【条件宏】

linux文件间传参最佳方式–a 30 --b 40
ARM开发板配置rzsz
arm开发板挂载win10和ubuntu haneWIN NFS Server
arm开发板挂载win10 nfsAxe NFS Server
Hi3516A SDK安装
git全局配置
git配置为只认unix换行符

Linux Parted分区工具超过2T空间分区
docker等系统操作遇到的问题
Excel单击单元格就进入编辑
ubuntu vim打开自动输入p问题
Xshell配置自动登录脚本
markdown基本使用
git的图形化工具Tortoise
excel宏匹配
excel合并工作簿VBA


2.2 语音

Kaldi的安装、训练、预测注意事项
语音识别思考
Hi3516a板交叉编译kaldi
Kaldi依赖库打包和裁剪
kaldi win10 vs2019 CPU和GPU下遇到的问题
VS2019单独编译WEBRTC VAD模块
kaldi安装SRILM语言模型库
一些语音awk命令解释日志
Kaldi的安装、训练、预测注意事项
Praat语音标注说明

Kaldi模型信息分析
lattice-arc-post计算边上累计得分
lattice输出到<phone-id,后验概率>对齐到每帧
lattice输出到<transition-id,后验概率>对齐到每帧
GMM音素对齐
chain模型音素对齐
理解lattice
lattice对齐ctm到phone
lattice对齐ctm到词
理解HCLG
nnet3-compute计算chain前向传播概率矩阵(声学模型输出)
计算chain声学模型帧对齐上的<pdf-id,后验概率>(不算语言模型)
声学模型计算到phone上后验概率和强制对其结果匹配
get_phone_post计算phone上概率并产生tacc和transform.mat
DNN-HMM中的状态、模型、对齐关系
kaldi的WFST、决策树可视化理解
kaldi的网络可视化
kaldi的feat和featbin特征可视化
浅浅理解Kaldi的IO流
Kaldi脚本utils/int2sym.pl解释
kaldi utils/filter_scp.pl脚本解释
SOX的一些命令和kaldi使用sox音频数据增强
FFMPEG的一些命令
nnet3-chain-copy-egs用于chain模型输入数据

理解RTF和RTX指标
在mobvoihotwords中遇到的问题
调试Kaldi
Kaldi VS2019下新建工程
kaldi vs2019编译cudadecoder模块的问题
kaldi遇到的问题
Kaldi的Python3库附加

万能librosa
理解FFT
tacotron2
声码器
i-vector提取
d-vector提取


2.3 机器学习

记录一下二分混淆矩阵
理解准确率和召回率
理解xgboost与gbdt区别

理解softmx
理解ROC和AUC
理解最小二乘
理解交叉熵损失
特征处理
LogisticRegression
gbdt
knn
kmeans
SVM
Jcaard距离(杰卡尔德距离,各种距离)
PLS系列001 数据预处理
PLS系列002 多因变量线性PLS
PLS系列003 单因变量线性PLS
PLS系列004 多因变量非线性PLS


2.4 自然语言处理

正则表达式使用的一些技巧
理解Transformer中的位置编码
NLP中的Embedding总结
keras简单使用bert
TensorFlow的一些trick
PyTorch一些trick
Could not load dynamic library cudart64_100.dll然用Anaconda3.7
朴素贝叶斯文本分类
预训练语言模型-W2V和fasttext
预训练语言模型-elmo
预训练语言模型-bert
预训练语言模型-bert-精简
Attention
Transformer
HAN
HMM原理
HMM前向算法——基于非比例因子(java实现)
HMM前向算法——基于比例因子(java实现)
HMM后向算法(java实现)
HMM预测算法——Viterbi(java实现)
HMM训练算法——BaumWelch(java实现)
RNN LSTM GRU
jieba分词原理


2.5 算法基础

0035搜索插入位置
快速排序
二分查找
最大公共子序列
编辑距离


2.6 视觉

目标检测yolo
视觉基础特征如SIFT
人脸识别
遥感影像中的知识点


2.7 Java

Java遇到的问题
JDK区别(78lamada、9Jshell、1011垃圾回收) JVM思想
HttpClientUtil帮助类
Java、JavaScript实现C#中String.format({0},)
InputStream的read方法


2.8 Python

Python Install和Python库
python科学计算遇到的问题
纯python安装Jupyter lab Debuger可视化工具
Python的virtualenv虚拟环境
pdb调试python


2.9 推荐排序

PageRank
SVD
隐语义模型
FM FFM
DeepFM


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值