
机器学习及统计学习
文章平均质量分 88
szdbl
学习是一生的事情,好奇心是出发点
展开
-
GBDT相关
Boosting算法族:boosting方法通过分步迭代(stage-wise)的方式来构建模型,在迭代的每一步构建的弱学习器都是为了弥补已有模型的不足1、AdaBoost:通过给已有模型预测错误的样本更高的权重,使得先前的学习器做错的训练样本在后续受到更多的关注的方式来弥补已有模型的不足2、梯度提升方法--以GBDT(Gradient Boosting Decison Tree)...转载 2020-03-23 15:19:35 · 314 阅读 · 0 评论 -
nlp相关
NLP之——Word2Vec详解一句话,word2vec就是用一个一层的神经网络(CBOW的本质)把one-hot形式的词向量映射到分布式形式的词向量,为了加快训练速度,用了Hierarchical softmax,negative sampling 等trick。Word2vec总共有两种类型--CBoW模型、Skip-gram模型,每种类型有两个优化算法--层次Softmax(Hier...原创 2020-03-19 20:56:31 · 430 阅读 · 0 评论 -
LR逻辑回归和sigmoid 函数
Q:1, 逻辑回归为什么要使用sigmoid函数.2, LR模型的意义,即为什么有了线性回归(linear regression)还需要逻辑回归(logistic regression)A:1、逻辑回归模型的定义:逻辑回归的输入是一个线性组合,与线性回归一样,但输出变成了概率那么需要一个函数将逻辑回归的输入(一个线性组合)与p联系起来。下面介绍这个函数,它的名字叫Logi...原创 2020-03-19 12:38:42 · 607 阅读 · 0 评论 -
用gbm包来提升决策树能力
中国有句老话:三个臭皮匠,顶个诸葛亮。这个说法至少在变形金刚中得到了体现,没有组合之前的大力神只是五个可以被柱子哥随手秒掉工地苦力。但组合之后却是威力大增。在机器学习领域也是如此,一堆能力一般的“弱学习器”也能组合成一个“强学习器”。前篇文章提到的随机森林就是一种组合学习的方法,本文要说的是另一类组合金刚: 提升方法(Boosting)。提升方法是一大类集成分类学习的统称。它用不同的权重将基原创 2015-09-18 15:47:44 · 2350 阅读 · 1 评论 -
logistic 回归
Logistic回归:实际上属于判别分析,因拥有很差的判别效率而不常用。 1. 应用范围:① 适用于流行病学资料的危险因素分析② 实验室中药物的剂量-反应关系③ 临床试验评价④ 疾病的预后因素分析2. Logistic回归的分类:① 按因变量的资料类型分:二分类多分类其中二分较为常用② 按研究方法分:条 件Logist原创 2015-09-18 15:47:10 · 716 阅读 · 0 评论 -
随机森林 VS Grad…
原文地址:VS Gradient Boost Decision Tree">随机森林 VS Gradient Boost Decision Tree作者:跋锋寒本文由LeftNotEasy发布于http://leftnoteasy.cnblogs.com决策树这种算法有着很多良好的特性,比如说训练时间复杂度较低,预测的过程比较快速,模型容易展示(容易将得到的决策树做成图片展示出来)等。但是同转载 2015-09-18 15:47:36 · 560 阅读 · 0 评论 -
svd++
SVD++ refersto a matrixfactorization modelwhich makes use of implicitfeedback information.In general, implicit feedback can refer to any kindsof users'history information that can help indicate转载 2015-09-18 15:48:19 · 755 阅读 · 0 评论 -
Deep learning和Reinforcement lea…
转自:http://www.infoq.com/cn/articles/atari-reinforcement-learning作者 尹绪森 发布于2014年3月31日引子说到机器学习最酷的分支,非Deep learning和Reinforcementlearning莫属(以下分别简称DL和RL)。这两者不仅在实际应用中表现的很酷,在机器学习理论中也有不俗的表现。DeepMi原创 2015-09-18 15:48:22 · 852 阅读 · 0 评论 -
在Windows下安装fasttext,并对中文文本进行Text classification
工作中遇到nlp相关的问题,从接手到今天有了一点眉目差不多三周时间。由于之前只是在理论上知道有nlp这一回事,这次的实践遇到很多坑,过程磕磕碰碰经历得很痛苦,在此记录下,以便有与我相似需求的同学有一点参考资料。首先我的工作环境是Windows7 64+Anaconda+Python 3.6,明确自己的工作环境很重要,因为在网上查找资料时很多解决方案都不适用于我这个环境,如果用的是li...原创 2019-04-10 17:28:56 · 2384 阅读 · 0 评论