
数据挖掘算法
文章平均质量分 79
JavaChaoCo
人生就像舞台,不到谢幕,永远都不知道自己能演得多精彩!
展开
-
几种算法的总结
1、线性回归2、广义线性回归(Logistic和泊松回归)3、主成分分析4、决策树5、相关规则原创 2016-03-21 18:04:53 · 833 阅读 · 1 评论 -
神经网络(优化算法)
神经网络(优化算法)人工神经网络(ANN),简称神经网络,是一种模仿生物神经网络的结构和功能的数学模型或计算模型。神经网络由大量的人工神经元联结进行计算。大多数情况下人工神经网络能在外界信息的基础上改变内部结构,是一种自适应系统。现代神经网络是一种非线性统计性数据建模工具,常用来对输入和输出间复杂的关系进行建模,或用来探索数据的模式。人工神经网络从以下四个方面去模拟人的智能行为:转载 2016-03-21 22:07:31 · 12879 阅读 · 0 评论 -
交叉验证(Cross-Validation)
转载自:http://blog.sina.com.cn/s/blog_688077cf0100zqpj.html详见:http://blog.sciencenet.cn/home.php?mod=space&uid=830496&do=blog&id=676326交叉验证(Cross-Validation): 有时亦称循环估计, 是一种统计学上将数据样本切割成较小子集的实用方法。于转载 2016-03-22 19:31:00 · 10632 阅读 · 0 评论 -
R语言之决策树和随机森林
特征选择、决策树、机器集成、随机森林原创 2016-04-07 20:40:53 · 8636 阅读 · 0 评论 -
昨晚阿里巴巴的一道面试题分析
昨晚参加阿里巴巴数据开发工程师的一道sql语句题搞蒙了,今早重新梳理了一下和大家分享一下原创 2016-04-21 11:15:14 · 1566 阅读 · 3 评论 -
最全Python爬虫总结
(1)普通的内容爬取(2)保存爬取的图片/视频和文件和网页(3)普通模拟登录(4)处理验证码登录(5)爬取js网站(6)全网爬虫(7)某个网站的站内所有目录爬虫(8)多线程 (9)爬虫框架Scrapy原创 2016-05-13 20:19:48 · 10939 阅读 · 0 评论 -
使用sklearn做单机特征工程
sklearn特征处理总结转载 2016-12-08 14:32:06 · 1261 阅读 · 0 评论 -
使用sklearn优雅地进行数据挖掘
使用sklearn进行数据挖掘转载 2016-12-08 14:42:13 · 1980 阅读 · 0 评论