machine learning
文章平均质量分 85
mantchs
世界如此复杂,我们将如何定义!
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
【Model Log】模型评估指标可视化,自动画Loss、Accuracy曲线图工具,无需人工参与!
文章目录1. Model Log 介绍2. Model Log 特性3. Model Log 演示地址4. Model Log 安装5. Model Log 使用5.1 启动 web 端5.2 Model Log API使用5.3 Model Log 使用示例1. Model Log 介绍Model Log 是一款基于 Python3 的轻量级机器学习(Machine Learning)、深度学习(Deep Learning)模型训练评估指标可视化工具,与 TensorFlow、Pytorch、Pad原创 2020-06-27 21:33:51 · 2652 阅读 · 1 评论 -
三步理解--门控循环单元(GRU),TensorFlow实现。
文章目录1. 什么是GRU2. ⻔控循环单元2.1 重置门和更新门2.2 候选隐藏状态2.3 隐藏状态3. 代码实现GRU4. 参考文献1. 什么是GRU在循环神经⽹络中的梯度计算⽅法中,我们发现,当时间步数较⼤或者时间步较小时,**循环神经⽹络的梯度较容易出现衰减或爆炸。虽然裁剪梯度可以应对梯度爆炸,但⽆法解决梯度衰减的问题。**通常由于这个原因,循环神经⽹络在实际中较难捕捉时间序列中时间步...原创 2019-08-16 15:41:29 · 8129 阅读 · 0 评论 -
四步理解GloVe!(附代码实现)
文章目录1. 说说GloVe2. GloVe的实现步骤2.1 构建共现矩阵2.2 词向量和共现矩阵的近似关系2.3 构造损失函数2.4 训练GloVe模型3. GloVe与LSA、Word2Vec的比较4. 代码实现5. 参考文献1. 说说GloVe正如GloVe论文的标题而言,**GloVe的全称叫Global Vectors for Word Representation,它是一个基于全局...原创 2019-08-24 10:24:01 · 4873 阅读 · 0 评论 -
CNN--卷积神经网络从R-CNN到Faster R-CNN的理解(CIFAR10分类代码)
文章目录1. 什么是CNN1.1 输入层1.2 卷积计算层(conv)1.3 激励层1.4 池化层1.5 全连接层1.6 层次结构小结1.7 CNN优缺点2. 典型CNN发展历程3. 图像相关任务3.1 图像识别与定位3.1.1 思路1:识别+定位过程3.1.2 思路2:图窗+识别3.2 物体检测(object detection)3.2.1 过程3.2.2 R-CNN3.2.3 SPP-Net3...原创 2019-08-11 14:36:54 · 1980 阅读 · 0 评论 -
神经网络优化算法:Dropout、梯度消失/爆炸、Adam优化算法,一篇就够了!
1. 训练误差和泛化误差机器学习模型在训练数据集和测试数据集上的表现。如果你改变过实验中的模型结构或者超参数,你也许发现了:当模型在训练数据集上更准确时,它在测试数据集上却不⼀定更准确。这是为什么呢?因为存在着训练误差和泛化误差:**训练误差:**模型在训练数据集上表现出的误差。**泛化误差:**模型在任意⼀个测试数据样本上表现出的误差的期望,并常常通过测试数据集上的误差来近似。训练...原创 2019-08-19 19:57:50 · 4011 阅读 · 2 评论 -
强化学习(Reinforcement Learning)中的Q-Learning、DQN,面试看这篇就够了!
文章目录1. 什么是强化学习2. 强化学习模型2.1 打折的未来奖励2.2 Q-Learning算法2.3 Deep Q Learning(DQN)2.3.1 神经网络的作用2.3.2 神经网络计算Q值3. 强化学习和监督学习、无监督学习的区别4. 什么是多任务学习5. 参考文献1. 什么是强化学习其他许多机器学习算法中学习器都是学得怎样做,而强化学习(Reinforcement Learni...原创 2019-08-18 17:41:26 · 4755 阅读 · 0 评论 -
一看就懂的K近邻算法(KNN),K-D树,并实现手写数字识别!
文章目录1. 什么是KNN1.1 KNN的通俗解释1.2 近邻的距离度量1.3 K值选择1.4 KNN最近邻分类算法的过程2. KDD的实现:KD树2.1 构建KD树2.2 KD树的插入2.3 KD树的删除2.4 KD树的最近邻搜索算法2.5 kd树近邻搜索算法的改进:BBF算法2.6 KD树的应用3. 关于KNN的一些问题4. 参考文献5. 手写数字识别案例1. 什么是KNN1.1 KNN的...原创 2019-08-02 10:24:31 · 1980 阅读 · 1 评论 -
我是这样一步步理解--主题模型(Topic Model)、LDA(案例代码)
文章目录1. LDA模型是什么1.1 5个分布的理解1.2 3个基础模型的理解1.3 LDA模型2. 怎么确定LDA的topic个数?3. 如何用主题模型解决推荐系统中的冷启动问题?4. 参考文献5. 代码实现1. LDA模型是什么LDA可以分为以下5个步骤:一个函数:gamma函数。四个分布:二项分布、多项分布、beta分布、Dirichlet分布。一个概念和一个理念:共轭先验和贝叶...原创 2019-07-28 15:59:21 · 3733 阅读 · 2 评论 -
你想知道的特征工程,机器学习优化方法都在这了!收藏!
文章目录1. 特征工程有哪些?1.1 特征归一化1.2 类别型特征1.3 高维组合特征的处理1.4 文本表示模型1.5 其它特征工程1.6 特征工程脑图2. 机器学习优化方法2.1 机器学习常用损失函数2.2 什么是凸优化2.3 正则化项2.4 常见的几种最优化方法3. 机器学习评估方法3.1 准确率(Accuracy)3.2 精确率(Precision)3.3 召回率(Recall)3.4 F1...原创 2019-07-27 10:15:06 · 1325 阅读 · 1 评论 -
激活函数、正向传播、反向传播及softmax分类器,一篇就够了!
文章目录1. 深度学习有哪些应用2. 什么是神经网络2.1 什么是感知器2.2 神经网络的结构2.3 为什么神经网络具有非线性切分能力3. 神经网络的计算过程3.1 计算过程3.2 随机初始化模型参数3.3 激活函数3.3.1 激活函数有哪些3.3.2 优缺点3.3.3 为什么使用激活函数3.3.4 人工神经网络中为什么ReLu要好过于tanh和sigmoid function?3.3.5 激活函...转载 2019-08-04 15:06:28 · 1739 阅读 · 0 评论 -
通俗易懂--循环神经网络(RNN)的网络结构!(TensorFlow实现)
文章目录1. 什么是RNN1.1 RNN的应用1.2 为什么有了CNN,还要RNN?1.3 RNN的网络结构1.4 双向RNN1.5 BPTT算法2. 其它类型的RNN3. CNN与RNN的区别4. 为什么RNN 训练的时候Loss波动很大5. 实例代码1. 什么是RNN循环神经网络(Recurrent Neural Network, RNN)是一类以序列(sequence)数据为输入,在序...原创 2019-08-15 14:41:17 · 2351 阅读 · 1 评论 -
自然语言处理(NLP)的一般处理流程!
文章目录1. 什么是NLP2. NLP主要研究方向3. NLP的发展4. NLP任务的一般步骤5. 我的NLP启蒙读本6. NLP、CV,选哪个?1. 什么是NLP自然语言处理 (Natural Language Processing) 是人工智能(AI)的一个子领域。**自然语言处理是研究在人与人交互中以及在人与计算机交互中的语言问题的一门学科。**为了建设和完善语言模型,自然语言处理建立计...原创 2019-08-20 19:36:10 · 6328 阅读 · 3 评论 -
XLNet预训练模型,看这篇就够了!(代码实现)
文章目录1. 什么是XLNet2. 自回归语言模型(Autoregressive LM)3. 自编码语言模型(Autoencoder LM)4. XLNet模型4.1 排列语言建模(Permutation Language Modeling)4.2 Transformer XL4.2.1 vanilla Transformer4.2.2 Transformer XL5. XLNet与BERT比较6...原创 2019-09-30 10:56:05 · 4379 阅读 · 1 评论 -
BERT预训练模型的演进过程!(附代码)
1. 什么是BERTBERT的全称是Bidirectional Encoder Representation from Transformers,是Google2018年提出的预训练模型,即双向Transformer的Encoder,因为decoder是不能获要预测的信息的。模型的主要创新点都在pre-train方法上,即用了Masked LM和Next Sentence Prediction两...原创 2019-09-28 21:55:08 · 2865 阅读 · 0 评论 -
Transformer各层网络结构详解!面试必备!(附代码实现)
1. 什么是Transformer《Attention Is All You Need》是一篇Google提出的将Attention思想发挥到极致的论文。这篇论文中提出一个全新的模型,叫 Transformer,抛弃了以往深度学习任务里面使用到的 CNN 和 RNN。目前大热的Bert就是基于Transformer构建的,这个模型广泛应用于NLP领域,例如机器翻译,问答系统,文本摘要和语音识别等...原创 2019-09-26 15:03:52 · 16778 阅读 · 2 评论 -
推荐系统--完整的架构设计和算法(协同过滤、隐语义)
1. 什么是推荐系统推荐系统是利用电子商务网站向客户提供商品信息和建议,帮助用户决定应该购买什么产品,模拟销售人员帮助客户完成购买过程。个性化推荐是根据用户的兴趣特点和购买行为,向用户推荐用户感兴趣的信息和商品。随着电子商务规模的不断扩大,商品个数和种类快速增长,顾客需要花费大量的时间才能找到自己想买的商品。这种浏览大量无关的信息和产品过程无疑会使淹没在信息过载问题中的消费者不断流失。为了解...原创 2019-09-09 09:37:18 · 1596 阅读 · 0 评论 -
Attention机制的精要总结,附:中英文机器翻译的实现!
1. 什么是Attention机制在“编码器—解码器(seq2seq)”⼀节⾥,解码器在各个时间步依赖相同的背景变量来获取输⼊序列信息。当编码器为循环神经⽹络时,背景变量来⾃它最终时间步的隐藏状态。现在,让我们再次思考那⼀节提到的翻译例⼦:输⼊为英语序列“They”“are”“watching”“.”,输出为法语序列“Ils”“regardent”“.”。不难想到,解码器在⽣成输出序列中的每⼀...原创 2019-08-31 18:46:45 · 1157 阅读 · 0 评论 -
seq2seq通俗理解----编码器和解码器(TensorFlow实现)
文章目录1. 什么是seq2seq2. 编码器3. 解码器4. 训练模型5. seq2seq模型预测5.1 贪婪搜索5.2 穷举搜索5.3 束搜索6. Bleu得分7. 代码实现8. 参考文献1. 什么是seq2seq在⾃然语⾔处理的很多应⽤中,输⼊和输出都可以是不定⻓序列。以机器翻译为例,输⼊可以是⼀段不定⻓的英语⽂本序列,输出可以是⼀段不定⻓的法语⽂本序列,例如:英语输⼊:“They”、...原创 2019-08-30 10:59:03 · 5228 阅读 · 2 评论 -
textRNN & textCNN的网络结构与代码实现!
1. 什么是textRNNtextRNN指的是利用RNN循环神经网络解决文本分类问题,文本分类是自然语言处理的一个基本任务,试图推断出给定文本(句子、文档等)的标签或标签集合。文本分类的应用非常广泛,如:垃圾邮件分类:2分类问题,判断邮件是否为垃圾邮件情感分析:2分类问题:判断文本情感是积极还是消极;多分类问题:判断文本情感属于{非常消极,消极,中立,积极,非常积极}中的哪一类。新闻主...原创 2019-08-27 08:41:51 · 6172 阅读 · 0 评论 -
迁移学习(Transfer),面试看这些就够了!(附代码)
文章目录1. 什么是迁移学习2. 为什么需要迁移学习?3. 迁移学习的基本问题有哪些?4. 迁移学习有哪些常用概念?5. 迁移学习与传统机器学习有什么区别?6. 迁移学习的核心及度量准则?7. 迁移学习与其他概念的区别?8. 什么情况下可以使用迁移学习?9. 什么是finetune?10. 什么是深度网络自适应?11. GAN在迁移学习中的应用12. 代码实现13. 参考文献1. 什么是迁移学习...原创 2019-08-18 10:48:13 · 13965 阅读 · 4 评论 -
白话--长短期记忆(LSTM)的几个步骤,附代码!
文章目录1. 什么是LSTM2. 输⼊⻔、遗忘⻔和输出⻔3. 候选记忆细胞4. 记忆细胞5. 隐藏状态6. LSTM与GRU的区别7. LSTM可以使用别的激活函数吗?8. 代码实现9. 参考文献1. 什么是LSTM在你阅读这篇文章时候,你都是基于自己已经拥有的对先前所见词的理解来推断当前词的真实含义。我们不会将所有的东西都全部丢弃,然后用空白的大脑进行思考。我们的思想拥有持久性。LSTM就是...原创 2019-08-17 18:33:53 · 2351 阅读 · 0 评论 -
K-Means(K均值)、GMM(高斯混合模型),通俗易懂,先收藏了!
文章目录1. 聚类算法都是无监督学习吗?2. k-means(k均值)算法2.1 算法过程2.2 损失函数2.3 k值的选择2.4 KNN与K-means区别?2.5 K-Means优缺点及改进3. 高斯混合模型(GMM)3.1 GMM的思想3.2 GMM与K-Means相比4. 聚类算法如何评估5. 代码实现1. 聚类算法都是无监督学习吗?什么是聚类算法?聚类是一种机器学习技术,它涉及到数据...原创 2019-07-25 20:34:58 · 9117 阅读 · 1 评论 -
从似然函数到EM算法(附代码实现)
文章目录1. 什么是EM算法1.1 似然函数1.3 极大似然函数的求解步骤1.4 EM算法2. 采用 EM 算法求解的模型有哪些?3.代码实现4. 参考文献1. 什么是EM算法最大期望算法(Expectation-maximization algorithm,又译为期望最大化算法),是在概率模型中寻找参数最大似然估计或者最大后验估计的算法,其中概率模型依赖于无法观测的隐性变量。最大期望算法经...原创 2019-07-21 12:13:09 · 1376 阅读 · 1 评论 -
《数学之美》--第一章:文字和语言 vs 数字和信息
PDF下载第一章文字和语言 vs 数字和信息数字、文字和自然语言一样,都是信息的载体,它们之间原本有着天然的联系。语言和数学的产生都是为了同一个目的—记录和传播信息。但是,直到半个多世纪前香农博士提出信息论,人们才开始把数学和信息系统自觉地联系起来。信息:自然语言就是信息的一种,其实从最初的动物世界,再到以人类为主导的世界,都是在传播消息,哪怕是发出怪叫声也是一样的。这跟现在的信息传播模型...原创 2019-04-07 13:21:56 · 320 阅读 · 0 评论 -
通俗易懂--岭回归(L2)、lasso回归(L1)、ElasticNet讲解(算法+案例)
目录1.L2正则化(岭回归)1.1问题1.2公式1.3对应图形1.4使用场景1.5代码实现2.L1正则化(lasso回归)2.1公式2.2对应图形2.3使用场景2.4代码实现3.ElasticNet回归3.1公式3.2使用场景3.3代码实现1.L2正则化(岭回归)1.1问题想要理解什么是正则化,首先我们先来了解上图的方程式。当训练的特征和数据很少时,往往会造成欠拟合的情况,对应的是左边的坐...原创 2019-01-08 23:39:35 · 1617 阅读 · 0 评论 -
通俗易懂--模型集成(多模型)讲解(算法+案例)
目录1.信用卡欺诈预测案例2.模型集成(model ensemble)2.1Bagging2.2Stacking2.3Adaboost2.4图解模型集成3.案例总流程4.初始化工作5.数据下采样6.模型训练6.1KNN6.2 SVM-RBF6.3 SVM-POLY6.4 Logistic Regression6.5 Random Forest6.6决策边界6.7 模型建模7.结果7.1预测7.2模...原创 2018-12-31 19:46:38 · 5910 阅读 · 0 评论 -
通俗易懂--决策树算法、随机森林算法讲解(算法+案例)
寻觅互联网,少有机器学习通俗易懂之算法讲解、案例等,项目立于这一问题之上,整理一份基本算法讲解+案例于文档,供大家学习之。通俗易懂之文章亦不可以面概全,但凡有不正确或争议之处,望告知,自当不吝赐教!GitHub地址(代码加数据)1.决策树1.1从LR到决策树相信大家都做过用LR来进行分类,总结一下LR模型的优缺点:优点适合需要得到一个分类概率的场景。实现效率较高。很好处...原创 2018-12-11 21:28:29 · 4036 阅读 · 1 评论 -
通俗易懂--SVM算法讲解(算法+案例)
标题1.SVM讲解1.1支持向量机(SVM)的由来1.2如何找到超平面函数间隔几何间隔1.3最大间隔分类器1.4后续问题1.5新闻分类实例寻觅互联网,少有机器学习通俗易懂之算法讲解、案例等,项目立于这一问题之上,整理一份基本算法讲解+案例于文档,供大家学习之。通俗易懂之文章亦不可以面概全,但凡有不正确或争议之处,望告知,自当不吝赐教!GitHub地址(代码加数据)1.SVM讲解SVM是一个...原创 2018-12-17 22:13:21 · 2893 阅读 · 0 评论 -
通俗易懂--逻辑回归算法讲解(算法+案例)
寻觅互联网,少有机器学习通俗易懂之算法讲解、案例等,项目立于这一问题之上,整理一份基本算法讲解+案例于文档,供大家学习之。通俗易懂之文章亦不可以面概全,但凡有不正确或争议之处,望告知,自当不吝赐教!GitHub地址(代码加数据)目录1.逻辑回归(Logistic Regression)1.1逻辑回归与线性回归的关系逻辑回归是用来做分类算法的,大家都熟悉线性回归,一般形式是Y=aX+b,y...原创 2018-12-11 10:21:54 · 4707 阅读 · 7 评论 -
通俗易懂--线性回归算法讲解(算法+案例)
寻觅互联网,少有机器学习通俗易懂之算法讲解、案例等,项目立于这一问题之上,整理一份基本算法讲解+案例于文档,供大家学习之。通俗易懂之文章亦不可以面概全,但凡有不正确或争议之处,望告知,自当不吝赐教!GitHub地址(代码加数据)1.线性回归(Linear Regression)1.1什么是线性回归我们首先用弄清楚什么是线性,什么是非线性。线性:两个变量之间的关系是一次函数关系的——图...原创 2018-12-10 16:24:10 · 5994 阅读 · 1 评论 -
机器学习-线性回归预测房价模型demo
这篇介绍的是我在做房价预测模型时的python代码,房价预测在机器学习入门中已经是个经典的题目了,但我发现目前网上还没有能够很好地做一个demo出来,使得入门者不能很快的找到“入口”在哪,所以在此介绍我是如何做的预测房价模型的题目,仅供参考。1.题目:        从给定的房屋基本信息以及房屋销售原创 2018-10-15 21:25:01 · 3110 阅读 · 0 评论 -
《数学之美》
之所以会写《数学之美》这本书的读书笔记,是因为我觉得这本书非常好,道出了数学上艺术的一面和美丽的一面。让我感觉以前所学的数学都没有白学,突然间变得有意义了,也更加的亲切。同时,我也是很佩服我自己居然能够在5天内读完这本书,而且还是一本关于数学方面的书,这还是我生平第一次。从以前的看到公式就烦的我,到一年前开始接触ML,再到现在的喜欢上数学这门学科,无疑是我这一年中最大的进步。我不奢求书本里的公式...原创 2019-04-07 13:23:32 · 447 阅读 · 0 评论 -
NLP从词袋到Word2Vec的文本表示
目录1.离散表示1.1 One-hot表示1.2 词袋模型1.3 TF-IDF1.4 n-gram模型1.5 离散表示存在的问题2. 分布式表示2.1 共现矩阵3.神经网络表示3.1 NNLM3.2 Word2Vec3.3 sense2vec4.代码实现在NLP(自然语言处理)领域,文本表示是第一步,也是很重要的一步,通俗来说就是把人类的语言符号转化为机器能够进行计算的数字,因为普通的文本语言机...原创 2019-05-09 20:17:38 · 2098 阅读 · 0 评论 -
贝叶斯网络,看完这篇我终于理解了(附代码)!
文章目录1. 对概率图模型的理解2. 细数贝叶斯网络2.1 频率派观点2.2 贝叶斯学派2.3 贝叶斯定理2.4 贝叶斯网络2.4.1 贝叶斯网络的结构形式2.4.2 因子图2.5 朴素贝叶斯3. 基于贝叶斯的一些问题4. 生成式模型和判别式模型的区别5. 代码实现6. 参考文献1. 对概率图模型的理解概率图模型是用图来表示变量概率依赖关系的理论,结合概率论与图论的知识,利用图来表示与模型有关...原创 2019-07-13 11:31:11 · 25873 阅读 · 6 评论 -
一次性弄懂马尔可夫模型、隐马尔可夫模型、马尔可夫网络和条件随机场!(词性标注代码实现)
文章目录1. 马尔可夫网络、马尔可夫模型、马尔可夫过程、贝叶斯网络的区别2. 马尔可夫模型2.1 马尔可夫过程3. 隐马尔可夫模型(HMM)3.1 隐马尔可夫三大问题3.1.1 第一个问题解法3.1.2 第二个问题解法3.1.3 第三个问题解法4. 马尔可夫网络4.1 因子图4.2 马尔可夫网络5. 条件随机场(CRF)6. EM算法、HMM、CRF的比较7. 参考文献8. 词性标注代码实现1....原创 2019-07-17 21:17:02 · 5287 阅读 · 0 评论 -
随机森林--你想到的,都在这了
文章目录1.什么是随机森林1.1 Bagging思想1.2 随机森林2. 随机森林分类效果的影响因素3. 随机森林有什么优缺点4. 随机森林如何处理缺失值?5. 什么是OOB?随机森林中OOB是如何计算的,它有什么优缺点?6. 随机森林的过拟合问题7. 代码实现1.什么是随机森林1.1 Bagging思想Bagging是bootstrap aggregating。思想就是从总体样本当中随机取...原创 2019-07-07 14:16:52 · 1199 阅读 · 0 评论 -
我是这样理解--SVM,不需要繁杂公式的那种!(附代码)
文章目录1. 讲讲SVM1.1 一个关于SVM的童话故事1.2 理解SVM:第一层1.2.1 函数间隔与几何间隔1.2.2 最大间隔分类器的定义1.2.3 最大间隔损失函数Hinge loss1.3 深入SVM:第二层1.3.1 从线性可分到线性不可分1.3.2 核函数Kernel1.3.3 总结1.4 SVM的应用2. SVM的一些问题3. LR和SVM的联系与区别3.1 相同点3.2 不同点4...原创 2019-07-11 21:39:21 · 952 阅读 · 0 评论 -
好记忆的机器学习面试--决策树
文章目录1. 什么是决策树1.1 决策树的基本思想1.2 “树”的成长过程这颗“树”长到什么时候停1.3 "树"怎么长1.3.1 ID3算法1.3.2 C4.51.3.3 CART算法举个例子1.3.4 三种不同的决策树2. 树形结构为什么不需要归一化?3. 分类决策树和回归决策树的区别4. 决策树如何剪枝5. 代码实现1. 什么是决策树1.1 决策树的基本思想其实用一下图片能更好的理解LR...原创 2019-07-06 15:40:28 · 435 阅读 · 0 评论 -
看完这篇,逻辑回归80%都懂了
文章目录1. 什么是逻辑回归2. 什么是Sigmoid函数3. 损失函数是什么4.可以进行多分类吗?5.逻辑回归有什么优点6. 逻辑回归有哪些应用7. 逻辑回归常用的优化方法有哪些7.1 一阶方法7.2 二阶方法:牛顿法、拟牛顿法:8. 逻辑斯特回归为什么要对特征进行离散化。9. 逻辑回归的目标函数中增大L1正则化会是什么结果。10. 代码实现1. 什么是逻辑回归逻辑回归是用来做分类算法的,大...原创 2019-07-06 11:44:16 · 361 阅读 · 0 评论 -
好记忆的机器学习面试--线性回归
文章目录1.什么是线性回归2. 能够解决什么样的问题3. 一般表达式是什么4. 如何计算4.1 Loss Function--MSE5. 过拟合、欠拟合如何解决5.1 什么是L2正则化(岭回归)5.2 什么场景下用L2正则化5.3 什么是L1正则化(Lasso回归)5.4 什么场景下使用L1正则化5.5 什么是ElasticNet回归5.6 ElasticNet回归的使用场景6. 线性回归要求因...原创 2019-07-05 21:52:30 · 761 阅读 · 0 评论
分享