
统计
光英的记忆
新世界,新创造
展开
-
统计学习方法知识索引
声明:本文所有内容及其链接内容均来自于统计学习方法,只为了本人学习使用,不做任何商业用途,特此声明,如有违规,可以联系我。 1,统计学习2,监督学习3,统计三要素4,模型评估与模型选择5,正则化和交叉验证6,泛化能力7,生成模型与判别模型8,分类问题9,标注问题 10,回归问题 感知机,感知机模型,感知机学习策略,感知机学习算法,算法的收敛性,感知机学习方法,感知机学习算法的对偶形式, ...原创 2019-03-19 21:54:37 · 252 阅读 · 0 评论 -
逻辑斯提回归与最大熵模型,模型学习的最优化算法,
原创 2019-03-30 09:54:01 · 221 阅读 · 0 评论 -
支持向量机,线性可分支持向量机与硬间隔最大化,线性可分支持向量机与软间隔最大化,线性可分支持向量机与核函数,序列最小最优化算法,
原创 2019-03-30 09:54:33 · 389 阅读 · 0 评论 -
提升方法,提升方法adaBoost算法,adaBoost算法的训练误差分析,adaBoost算法的解释,提升树,
原创 2019-03-30 09:55:08 · 437 阅读 · 0 评论 -
EM算法及其推广,EM算法的收敛性,EM算法在高斯混合模型学习中的应用,
原创 2019-03-30 09:55:44 · 390 阅读 · 0 评论 -
隐马尔科夫模型,概率计算算法,
原创 2019-03-30 09:56:14 · 440 阅读 · 0 评论 -
条件随机场,概率无向图模型,条件随机场的概率计算问题,条件随机场的学习算法,条件随机场的预测算法,
原创 2019-03-31 14:34:14 · 368 阅读 · 0 评论 -
统计学习方法总结
原创 2019-03-31 14:35:58 · 217 阅读 · 0 评论 -
梯度下降法
原创 2019-03-31 14:33:16 · 141 阅读 · 0 评论 -
牛顿法与拟牛顿法,
原创 2019-03-31 14:36:32 · 168 阅读 · 0 评论 -
决策树,决策树模型与学习,特征选择,决策树的生成,决策树的剪枝,cart算法,
原创 2019-03-30 09:53:30 · 626 阅读 · 0 评论 -
朴素贝叶斯法,朴素贝叶斯法的学习与分类,朴素贝叶斯法的参数估计,
原创 2019-03-30 09:53:03 · 417 阅读 · 0 评论 -
K近邻法,K近邻算法,K近邻模型,K近邻算法的实现:kd树
原创 2019-03-30 09:51:57 · 225 阅读 · 0 评论 -
在对数据进行预处理时,应该怎样处理类别型特征?
类别型主要指性别,血型等只有在有限选项内取值的特征。类别型特征原始输入通常是字符串形式,除了决策树等少量模型能直接处理字符串形式的输入,对于逻辑回归,支持向量机等模型来说,类别型特征必须经过处理转换成数值型特征才能正确工作。在对数据进行预处理时,应该怎样处理类别型特征?序号编码 Ordinal Encoding 序号编码通常处理类别间具有大小关系的数据。例如成绩,可以分为低,中...原创 2019-03-19 22:44:53 · 3285 阅读 · 0 评论 -
如何处理高纬度组合特征?什么是组合特征?
什么是组合特征?为了提高复杂关系的拟合能力,在特征工程中经常会把一阶离散 特征两两组合,构成高阶组合特征。如何处理高纬度组合特征?假设用户数量M 和物品数量N为组合特征,那么学习的参数就是m*n,然而m和n 可能是千万级别的数量级,几乎无法学习m*n数量级的规模的参数。在这种情况下一种有效的方法就是对m,和n分别用k维的低纬向量来表示。那么学习的参数将从m*n,变成k*m+n...原创 2019-03-19 23:12:09 · 1813 阅读 · 0 评论 -
怎样有效的找到组合特征?
1原创 2019-03-20 08:39:52 · 960 阅读 · 0 评论 -
有哪些文本表示模型?它们各有什么优缺点?
1.词袋模型 和 N-gram模型词袋模型最基础的文本表示模型是词袋模型。顾名思义,就是将每篇文章看成一袋子词,并忽略每个词出现的顺序。就是将整段文本以词为单位切分开,然后每篇文章可以表示成一个长向量,向量中的每一维代表一个单词,而该维对应得权重则则反映了这个词在原文章的重要程度。 常用TF-IDF来计算权重,公式为: ...原创 2019-03-20 21:00:09 · 5007 阅读 · 1 评论 -
Word2vec是如何工作的?它和LDA有什么区别和联系?
Word2vec是目前最常用的词嵌入模型之一。是一种浅层的神经网络模型,他有2种网络结构,分别是CBOW(continues bag of words)和 skip-gram.Word2vec 隐狄利克雷模型(LDA),CBOW,Skip-gramWord2vec是如何工作的?CBOW的目标是根据上下文出现的词语来预测当前词的生成概率:Skip-gram模型是根据当前词来...原创 2019-03-21 23:19:57 · 2535 阅读 · 0 评论 -
在图像分类任务中,训练数据不足会带来什么问题?如何缓解数据量不足带来的问题?
知识点:迁移学习(Transfer Learning),生成对抗网络,图像处理,上采样技术,数据扩充一个模型所能提供的信息一般来源于2个方面,一是训练数据中蕴含的信息,二是在模型的形成过程中(包括构造,学习,推理等),人们提供的先验信息。当训练数据不足时,说明模型从原始数据中获取的信息比较少,这种情况下要保证模型的效果,就需要更多的先验信息。先验信息可以作用在模型上,例如让模型...原创 2019-03-22 00:00:13 · 8955 阅读 · 0 评论 -
准确率Accuracy的局限性
前提问题分析:Hulu的奢侈品用户广告主们希望把广告定向投放给奢侈品用户。Hulu通过第三方数据平台(DMP)拿到了一部分奢侈品用户的数据,并以此为训练集合测试集,训练和测试奢侈品用户的分类模型。该模型的分类准确率超过了95%,但在实际广告投放过程中,该模型还是把大部分广告投给了非奢侈品用户,还肯能是什么原因造成的?准确率的局限性准确率是指分类正确的样本占总样本的比例:Accuar...原创 2019-03-22 12:01:42 · 2941 阅读 · 0 评论 -
1,统计学习2,监督学习3,统计三要素4,模型评估与模型选择5,正则化和交叉验证6,泛化能力7,生成模型与判别模型8,分类问题9,标注问题 10,回归问题
原创 2019-03-30 09:49:09 · 321 阅读 · 0 评论 -
感知机,感知机模型,感知机学习策略,感知机学习算法,算法的收敛性,感知机学习方法,感知机学习算法的对偶形式,
原创 2019-03-30 09:51:28 · 264 阅读 · 0 评论 -
拉格朗日对偶性
原创 2019-03-31 14:35:06 · 159 阅读 · 0 评论