
机器学习
文章平均质量分 95
寻沂
这个作者很懒,什么都没留下…
展开
-
Transformer position encoding 的细节
在自然语言处理、语音识别和推荐系统当中,需要处理一类独特的数据:。序列数据的特点,决定了序列处理的特性。在常见的序列处理当中,我们面对的序列主要有以下几个特点。这里以情感分析为例子PositiveNegative在上面的例子当中,仅仅只是因为don‘t 位置的不同,就导致了这两个句子的情感标注一个是正向的,一个是负向的。也就是说,在自然语言处理场景中,词汇之间的顺序关系对语意十分重要。词汇的含义可以由其上下文表示。原创 2023-08-01 11:31:41 · 222 阅读 · 0 评论 -
在RNN里绕蒙圈
在上次Seq2Seq的基础之上,我们聊一下RNN。什么是RNN在了解RNN的具体原理之前,我们先来看一下WIKI对RNN的介绍。A recurrent neural network (RNN) is a class of artificial neural networks where connections between nodes form a directed graph along a temporal sequence. This allows it to exhibit tempora原创 2020-07-28 11:36:43 · 294 阅读 · 0 评论 -
什么是Seq2Seq模型
前段在公司做YouTube Dnn模型的复现,然后想在YouTube Dnn里面加一下魔幻的搭配,就去了解了一下Attention。可是很多事情要更详细的了解难免追根溯源。所以,最后回溯到Seq2Seq模型,本篇主要介绍一下Seq2Seq相关的一些内容,为后面的Attention机制的了解做一下铺垫。一般我在了解一个新概念之前会先找一个稍微正经一点的资料,不要被中文资料把自己带跑偏。一般用的是维基百科。什么是Seq2Seq模型维基百科里面关于Seq2Seq的介绍:Seq2seq is a fa原创 2020-07-28 11:39:31 · 3596 阅读 · 2 评论 -
深度学习word2vec笔记之算法篇
本文转载自《深度学习word2vec笔记之算法篇》对排版和内容作了部分调整,感谢大佬分享。PDF版本关注微信公众号:【终南樵】,回复:【word2vec】获取1. 声明该博文是Google专家以及多位博主所无私奉献的论文资料整理的。具体引用的资料请看参考文献。具体的版本声明也参考原文献本文仅供学术交流,非商用。所以每一部分具体的参考资料并没有详细对应,更有些部分本来就是直接从其他博客复制过来的。如果某部分不小心侵犯了大家的利益,还望海涵,并联系老衲删除或修改,直到相关人士满意为止。本人才疏学浅转载 2020-09-01 14:33:40 · 479 阅读 · 0 评论 -
Candidate Sampling
介绍了sampling-based approach在多分类问题上的使用介绍了NCE和IS的区别,简单介绍了TensorFlow中sampled softmax的使用原创 2020-10-04 15:14:17 · 442 阅读 · 0 评论 -
YouTube DNN在召回上的一些实验记录——负样本的选取
YouTube DNN复现的经验原创 2020-07-28 11:37:32 · 2086 阅读 · 4 评论 -
YouTube DNN论文精读
文章目录Abstract1. Introduction2. System Overview3. Candidate Generation3.1 Recommendation as classification3.2 Model Architecture3.3 Heterogeneous Signals3.4 Label and Context Selection3.5 Experiments with Features and Depth4. RANKING4.1 Feature Representatio原创 2021-01-14 16:12:03 · 957 阅读 · 0 评论 -
通用近似定理
In the mathematical theory of artificial neural networks, the universal approximation theorem states[1] that a feed-forward network with a single hidden layer containing a finite number of neurons can approximate continuous functions on compact subsets of.原创 2020-07-28 11:38:44 · 1708 阅读 · 0 评论 -
模型评估:ROC曲线的绘制和AUC的计算
文章目录混淆矩阵ROC1. 什么是ROCROC和模型的评估1. ROC曲线的绘制2. ROC曲线的具体意义AUCAUC值的含义AUC值的计算资料混淆矩阵在了解ROC之前,我们首先来了解一下混淆矩阵。对于给出的一个二分类问题,在混淆矩阵中:横向表示样本对应的标签正例和负例的真实情况。纵向表示样本对应的标签正例和负例的预测情况。其中:TP: 表示predict为True, label为positive的情况。FP: 表示predict为False, label 为positive原创 2020-07-28 11:37:49 · 3283 阅读 · 0 评论 -
躺平国历险记:两个超平面之间距离的计算
王二麻听说躺平国是一个非常神奇的地方。在躺平国里,有各种神奇的东西。比如:会说话的铁片,能够分拣垃圾的小狗,还有会唱京剧的电线杆子。王二麻的表哥张三李是一个糙汉子,他前几年在国内混不下去了,一个人去了躺平国。那是一个快乐的国度,每一个人都可以躺平,或者做自己热爱的事情。日常的事物交给特点的躺平机处理。王二麻也想去躺平国,但是在去躺平国的路上需要经历许许多多的困难。 他非常的畏惧。于是...原创 2020-07-28 16:35:08 · 1732 阅读 · 0 评论 -
无敌的Log-Likelihood Ratio(1)——LLR的计算方式
Log Likelihood Ratio的计算公式和代码实现以及相关的原理性的东西。希望和大家一起讨论,一起进步。原创 2020-07-27 17:30:28 · 17466 阅读 · 1 评论 -
交叉熵三连(3)——交叉熵及其使用
主要介绍交叉熵以及交叉熵在机器学习中作为损失函数使用的方式。为什么需要使用交叉熵做损失函数,以及一些迷失的地方,欢迎大家讨论。原创 2020-07-27 17:30:57 · 781 阅读 · 6 评论 -
利用tensorflow keras搭建一个简单的卷积神经网络
源码下载点击这里1 运行结果(1)首先我们在cnn.py中建立一个卷积神经网络,建立卷积神经网络,并通过输入:python cnn.py运行程序,程序运行的结果如下所示: 根据图示中的结果可知,在我们搭建的卷积神经网络中需要在线下载mnist手写字体的数据集合。再次运行python cnn.py运行过程如下所示: 在运行过程中,通过12次迭代对6000张手写字体数据集合图片进行训练,如上原创 2020-07-26 15:30:19 · 6110 阅读 · 0 评论 -
交叉熵三连(2)——KL散度(相对熵)
1. KL散度的定义2. KL散度的性质2.1 Gibbs不等式和KL散度的非负性2.2 KL散度的不对称性3 KL散度在计算文本距离上的使用原创 2020-07-27 17:29:45 · 1039 阅读 · 0 评论 -
Kmeans 算法理论和Python实现(一)——简单K-Means实现
1. Kmeans算法原理1.1 Kmeans算法介绍聚类算法是一种无监督学习方法,将相似的对象归到同一个簇中。在K-Means算法中,我们将所有的数据划分到K个不同的簇中并且每一个簇的中心是该簇中所有的节点的均值计算得到,因此称为K—均值算法。在机器学习中聚类和分类算法最大的不同在于,分类的目标事先是已知的,而聚类则不同,聚类的目标是未知的。分类产生的结果是分类前已经知晓的结果,而聚类产生的结果是原创 2020-07-26 15:33:47 · 3120 阅读 · 0 评论 -
Spark随机森林算法对数据分类(一)——计算准确率和召回率
1.召回率和正确率计算对于一个KK元的分类结果,我们可以得到一个K∗KK*K的混淆矩阵,得到的举证结果如下图所示。 从上图所示的结果中不同的元素表示的含义如下: mijm_{ij} :表示实际分类属于类ii,在预测过程中被预测到分类jj对于所有的mijm_{ij}可以概括为四种方式不同类型的数据:TPTP(真正):真正的分类结果属于ii预测的结果也属于ii,此时对于 mijm_{ij} 而言i=原创 2020-07-26 15:31:43 · 15420 阅读 · 3 评论 -
Spark MLlib 决策树算法(一)——理论基础
1 决策树算法1.1 决策树决策树(Decision Tree)是一个树结构(可以是二叉树或者非二叉树),决策树又节点和有向边组成。 决策树节点类型分类:内部节点,叶子节点。内部节点表示属性,外部节点表示一个类。其每一个内部节点表示一个特征属性上的测试,每一个分支代表这个特征属性在某个值阈上的的输出,而每个叶子节点代表一个类型。 决策树分类的本质:从训练集上归纳出一组分类规则,通常原创 2020-07-26 15:29:35 · 1156 阅读 · 1 评论 -
决策树的python代码注解
通过python实现简单的ID3决策树分裂算法原创 2020-07-26 15:30:00 · 5255 阅读 · 2 评论