
数据挖掘
文章平均质量分 92
iterate7
阳春布德泽,咱能生光辉?
百川东到海,不能复西归,
少壮要努力,以免徒伤悲!
展开
-
word2vec
Word2vec 可以通过训练语料(不需要熟语料),针对每个词产生一个向量(word representations or word embeddings)。 非常简单有效,是deep learning应用到NLP领域的一个非常好的模型。原创 2015-12-11 15:47:57 · 1205 阅读 · 0 评论 -
机器学习的第一步:数据预处理
背景以前讲过一篇关于特征缩放的,其实本质也是特征预处理,使得标注化。https://blog.youkuaiyun.com/iterate7/article/details/78881562这里主要是巩固,同时结合sklearn里的代码直接来看。标准化z-score方法x′=x−μσx' = \dfrac{x - \mu}{\sigma}x′=σx−μ翻译公式为:(x-mean)/std 计...原创 2019-10-05 11:08:49 · 1067 阅读 · 0 评论 -
知识引擎
知识引擎的几个层次原创 2019-04-06 09:10:20 · 853 阅读 · 0 评论 -
bootstrap自采样再理解
前言本文要讨论的并非是Bootstrap工具包,而是统计学习中一种重采样(Resampling)技术。下面引用的是谢益辉博士关于Bootstrap (和 Jackknife)基本思想的论述,希望能帮助读者对于Bootstrap 建立一个初步的认识:在统计的世界,我们面临的总是只有样本,Where there is sample, there is uncertainty,正因为不确定性...原创 2018-03-29 15:11:50 · 27099 阅读 · 9 评论 -
机器学习中的特征缩放(feature scaling)浅谈
引言在运用一些机器学习算法的时候不可避免地要对数据进行特征缩放(feature scaling),比如:在随机梯度下降(stochastic gradient descent)算法中,特征缩放有时能提高算法的收敛速度。什么是特征缩放特征缩放的目标就是数据规范化,使得特征的范围具有可比性。它是数据处理的预处理处理,对后面的使用数据具有关键作用。机器算法为什么要特征缩放特征缩放还可以使机器学习算法工作的原创 2017-12-23 18:51:56 · 14124 阅读 · 0 评论 -
EM算法(具体到抽象)
EM算法的例子和思想,以及算法流程。 从具体到抽象再到具体。原创 2017-11-12 19:33:30 · 735 阅读 · 0 评论 -
cnn在sentence分类和向量实验
cnn简介其中: 每一个行是一个word2vec的向量。 共n行,代表n个词。 然后卷积运算,窗口是3,4,5。输入层 如图所示,输入层是句子中的词语对应的word vector依次(从上到下)排列的矩阵,假设句子有 n 个词,vector的维数为 k ,那么这个矩阵就是 n×k的。这个矩阵的类型可以是静态的(static),也可以是动态的(non static)。静态就是word ve原创 2017-08-10 20:02:38 · 1445 阅读 · 0 评论 -
K-Means简记
K-Means聚类算法。基础含义K-Means是一种聚类算法,它可以把n个对象根据相互之间的相似度,自动划分到K个聚类。 但并不是任意的划分,我们有明确的目标。通俗的讲,目标就是划分后的聚类, 每个类内部相对集中;而聚类与聚类之间则相对离散。数学原理给定n个观察点X1,X2,...,XnX_1,X_2,...,X_n 其中每个观察点XiX_i都是d维向量,也就是说,只要把原创 2017-07-15 22:33:08 · 639 阅读 · 0 评论 -
朴素贝叶斯简记
朴素贝叶斯分类器naive bayes classifier,简单梳理其数学公式,基本思想,并简单应用到搜索引擎的用户意图识别中。原创 2015-12-31 10:08:26 · 740 阅读 · 0 评论 -
GridSearch & Kfold & cross validation
what’s cross validation?Cross-validation is a technique that is used for the assessment of how the results of statistical analysis generalize to an independent data set. Cross-validation is largely u...原创 2019-10-06 09:02:01 · 716 阅读 · 0 评论