ML
文章平均质量分 77
mlee1018
进步,一点点
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
逻辑斯特回归(随机梯度上升算法)预测马疝病的死亡率问题
预测马疝病死亡率github代码随机梯度上升(下降)算法推导过程:使用的一些变量,类别标签向量yy,数据集样本矩阵XX,回归系数向量WW,观察值与真实值偏差向量ee,步长(学习率)α\alpha,PS:以上向量均为标准列向量。原创 2017-12-25 17:54:08 · 718 阅读 · 0 评论 -
TensorFlow中髙维张量乘法运算(RNN批量序列损失计算)
髙维张量tensor之间的乘法,均类似于二维矩阵的乘法,但需要满足最后两个维度符合矩阵乘法要求的维度,且其他维度均必须要相等的原则import tensorflow as tfimport numpy as npa = tf.constant(np.arange(1, 13, dtype=np.float32), shape=[2, 2, 3])b = tf.constant(np.ar...原创 2019-05-05 17:27:55 · 6158 阅读 · 0 评论 -
基于矩阵分解的推荐算法
推荐系统        \ \ \ \ 我们知道,协同过滤算法(Collaborative Filtering)是最常用的推荐算法,其就是通过从用户(User)的历史行为数据中挖掘出用户的兴趣,并为其推荐可能感兴趣的项(Item),常用的方法有,基于用户的协同过滤算法和基于项的协同过滤算法。 &a原创 2018-05-06 22:07:33 · 12226 阅读 · 1 评论 -
决策树算法原理及实现
欢迎大家查看实现的完整代码。。。决策树模型 \ \ \ \ 分类决策树模型是一种描述对实例进行分类的树形结构。决策树由结点和有向边组成。结点有两种类型:内部节点和叶节点,内部节点表示一个特征或属性,叶节点表示一个分类类别。 &nbs原创 2018-03-14 16:33:32 · 1557 阅读 · 0 评论 -
聚类算法之K-Means算法
聚类 \ \ \ \ 对大量未进行标注(Unsupervised learning)的数据集,并按照数据集本身的内部数据特征将数据划分为多个不同的类别,从而使得类别内的数据相似度高,而类别间的数据差异性较大。因此,它的重点就在于计算样本间的相似度(Similarity)。k-means算法思想与原理 \ \ \ \ 输入算法所需数据,数据样本集D={X1,X2,⋯,Xm}\mathcal原创 2018-03-06 12:50:35 · 12585 阅读 · 0 评论 -
优化问题之拉格朗日乘子法&KKT条件分析
优化问题, 拉格朗日函数无约束优化问题minf(x)minf(x)\min f(x),由Fermat’s theorem可知,可微函数的极值点都是其驻点(必要条件),故令其导数为零即可求解,当然也可利用梯度下降算法求解;等式约束优化问题minf0(x), s.t., hi(x)=0, i=1,2,⋯,pminf0(x), s.t.,&...原创 2018-03-11 13:51:59 · 5979 阅读 · 0 评论 -
泰坦尼克之灾(逻辑回归应用)
问题背景及其描述 \ \ \ \ 背景描述戳这里主要讲述了,在泰坦尼克号的首航中,不幸与冰山相撞,导致大量乘客与船员伤亡,而没有足够的救生艇是造成这次悲剧的主要原因之一。虽说那些幸存者是比较幸运的,但很明显对于妇女、孩子以及上层阶级等这些群体的人是更可能幸存下来的。So,我们的任务就是根据提供的初始数...原创 2018-03-02 18:40:40 · 1124 阅读 · 0 评论 -
简述LDA,PCA,SVD原理推导及其简单应用
线性判别分析(Linear Discriminant Analysis) \ \ \ \ 对于给定的标记数据(xi,ci),其中xi∈Rn,ci∈{0,1}(x_i, c_i), 其中x_i\in \mathcal{R^n},c_i\in \{0, 1\},此时设计一个分类器(Classifier),将这两类数据分开,另外这两类数据线性可分(存在一个超平面Σ1\mathcal{\Sigma_原创 2018-03-01 17:12:33 · 960 阅读 · 0 评论 -
numpy,scipy,matplotlib,pandas等简明教程
numpy中文文档(updating…) numpy,scipy,matplotlib,pandas,keras,scikit-learn简明实例教程基础部分 numpy的主要对象是一个同类元素的多维数组. 这是一个所有元素均为同种类型,并通过正整数元组来进行索引的元素(一般为数字)表. 在numpy中维度(dimensions)称之为轴(axes). 数目称之为秩(rank). 就比...原创 2017-09-17 20:27:52 · 2233 阅读 · 0 评论 -
信息论基本概念(熵、联合熵、条件熵、相对熵、互信息)讲述与推导
熵(Entropy) 熵是随机变量的不确定性的度量。设 X " role="presentation"> X X \ X\ 是一个离散的随机变量,其取值空间为 X " role="presentation"> X X \ \mathcal{X}\ ,概率密度函数p(x)=P(X=x),x∈X" role="presentation原创 2018-01-17 18:06:44 · 16835 阅读 · 0 评论 -
机器学习常用数学公式(梯度说明)
输入为标量(Scalar)f(xk+δ) ≈ f(xk)+f′(xk)δ+f′′(xk)δ22 δ+xk∈U˚(xk)f(xk+δ) ≈ f(xk)+f′(xk)δ+f″(xk)δ22 δ+xk∈U˚原创 2017-12-25 21:02:59 · 14624 阅读 · 0 评论 -
使用朴素贝叶斯进行文档分类
朴素贝叶斯文档分类github代码朴素(naive)贝叶斯之朴素 这里的朴素一词是指,即一个特征或者某个词条(token)的出现的可能性与它和其他单词的相邻性没有关系(当然,这个假设是不合理的,就如水果一词出现在健康一词周围的概率就明显高于出现在不健康一词周围的概率),另外需要补充的是,这里的每一个特征也假设是同等重要的(也就是说每一个词条只考虑出现与否(set-of-words model)原创 2017-12-27 15:22:23 · 4640 阅读 · 0 评论 -
matplotlib简单教程
Simple plotIn this section, we want to draw the cosine and sine functions on the same plot. Starting from the default settings, we’ll enrich the figure step by step to make it nicer.import numpy...原创 2017-12-25 21:11:38 · 506 阅读 · 0 评论 -
机器学习中评估算法的常用评价指标
评价指标 对于自然语言处理(NLP)、机器学习(ML)、信息检索(IR)等领域,评估(Evaluation)是一个必要的工作,而这其中所涉及到的评价指标一般包括:准确率(Accuracy)、精确率(Precision)、召回率(Recall)以及F1-measure TP(True Positive)、TN(True Negative)、FP(False Positive)、F...原创 2017-12-25 21:00:42 · 1485 阅读 · 0 评论 -
RNN(LSTM)数据形式及Padding操作处理变长时序序列dynamic_rnn
SummaryRNN样本一样,计算的状态值和输出结构一致,也即是说只要当前时刻的输入值也前一状态值一样,那么其当前状态值和当前输出结果一致,因为在当前这一轮训练中权重参数和偏置均未更新RNN的最终状态值与最后一个时刻的输出值一致输入数据要求格式为,shape=(batch_size, step_time_size, input_size),那么,state的shape=(batch_s...原创 2019-05-05 17:54:01 · 18629 阅读 · 3 评论
分享