
数据挖掘
文章平均质量分 81
bestlinjiayin
机器学习+数据挖掘
展开
-
R 和 python浅析
转载于:http://www.fangfa.net/webnews/649.html总的概括:R主要在学术界流行,python(numpy scipy)在工程方便比较实用。R是S(Splus)的开源版本,或者下一代。发源地在新西兰奥克兰。这个软件的统计背景很浓烈。我这里浓烈的意思是,如果你不熟习统计知识(历史)的话,R的帮助文档看起来是很累的。由统计背景的人开发。R的维护组叫CRA转载 2015-03-16 10:42:05 · 835 阅读 · 0 评论 -
数据挖掘的数据集资源
数据挖掘的数据集资源来自互联网:1、气候监测数据集 http://cdiac.ornl.gov/ftp/ndp026b2、几个实用的测试数据集下载的网站http://www.cs.toronto.edu/~roweis/data.html http://www.cs.toronto.edu/~roweis/data.html http://kdd.ics.uci.edu/summary.task转载 2015-07-27 15:21:08 · 818 阅读 · 0 评论 -
约翰霍普金斯大学数据科学系列课程——R语言:数据类型
约翰霍普金斯大学数据科学系列课程——R语言:数据类型讲得比较清晰的一篇博文http://blog.youkuaiyun.com/linkin1005/article/details/435597831.原子对象R语言有5类最基本的原子对象:1) 字符型character字符型对象用” ”包括。2) 数值型numeric(rea转载 2015-11-04 15:20:49 · 1651 阅读 · 0 评论 -
决策树ID3、C4.5、CART算法:信息熵,区别,剪枝理论总结
决策树ID3、C4.5、CART算法:信息熵,区别,剪枝理论总结转载 2015-09-22 12:46:32 · 3125 阅读 · 0 评论 -
CART分类决策树、回归树和模型树算法详解及Python实现
机器学习经典算法详解及Python实现–CART分类决策树、回归树和模型树 摘要: Classification And Regression Tree(CART)是一种很重要的机器学习算法,既可以用于创建分类树(Classification Tree),也可以用于创建回归树(Regression Tree),本文介绍了CART用于离散标签分类决策和连续特征回归时的原理。决策树创建过程分析了信息转载 2015-09-22 12:56:01 · 4033 阅读 · 0 评论 -
如何在Kaggle中高效搜索数据集?
雷锋网(公众号:雷锋网) AI科技评论按:对于关注数据科学的同学来说,Kaggle上庞大的数据集是一个极好的资源池,但是这么多的数据,如何进行更精准的搜索?近日,Kaggle官方博客就刊登了Rachael Tatman的一篇文章,向大家安利如何更高效的搜索数据集,具体怎么操作?雷锋网 AI科技评论将文章编译整理如下:目前,在Kaggle上有成千上万的数据集,而且每天都会有新的增加。虽说Ka转载 2017-09-16 10:48:14 · 8532 阅读 · 1 评论