
数据挖掘理论
yitianguxingjian
数据仓库、数据挖掘、数据分析、机器学习、Teradata、SQL、Python、Spark、Hive、R、SPSS Modeler
展开
-
LASSO-Logistic模型--基于R语言glmnet包
R语言中glmnet包是比较重要且流行的包之一,曾被誉为“三驾马车”之一。从包名就可以大致推测出,glmnet主要是使用Elastic-Net来实现GLM,广大的user可以通过该包使用Lasso 、 Elastic-Net 等Regularized方式来完成Linear Regression、 Logistic 、Multinomial Regression 等模型的构建。本人学习了CRAN上G原创 2017-04-09 18:54:08 · 65975 阅读 · 8 评论 -
朴素贝叶斯与朴素贝叶斯分类法
PS:如上是我根据个人的理解对朴素贝叶斯公式及朴素贝叶斯分类器的理解,如有错误请拍砖。1、由于有很多的公式,所以直接粘贴了图片,给阅读者造成了不变;2、在第三部分分享了“梦醒潇湘love”关于邮件分类的材料,具体博客地址为:http://blog.chinaunix.net/uid-26548237-id-3853480.html原创 2016-06-08 16:39:29 · 750 阅读 · 0 评论 -
关于 极大似然估计和EM算法(挺好的文章)
http://blog.youkuaiyun.com/zouxy09/article/details/8537620转载 2016-06-07 17:16:25 · 795 阅读 · 0 评论 -
极大似然估计
一、理论基础1、引例某位同学与一位猎人一起外出打猎,一只野兔从前方窜过。只听一声枪响,野兔应声到下,如果要你推测,这一发命中的子弹是谁打的?你就会想,只发一枪便打中,由于猎人命中的概率一般大于这位同学命中的概率,看来这一枪是猎人射中的。 这个例子所作的推断就体现了极大似然法的基本思想。2、简介极大似然估计是一种在总体概率密度函数和样本信息的基础上,求解模型中未知参数估值的方法。原创 2016-06-07 16:53:34 · 2597 阅读 · 0 评论