- 博客(5)
- 收藏
- 关注
转载 SVM入门
至今见过介绍SVM最好的博文,全文分享~http://blogjava.net/zhenandaci/archive/2009/02/13/254519.html(一)SVM的八股简介支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器...
2018-11-13 14:01:44
238
转载 信息增益介绍
优秀博文,全文转载:http://www.blogjava.net/zhenandaci/archive/2009/03/24/261701.html前文提到过,除了开方检验(CHI)以外,信息增益(IG,Information Gain)也是很有效的特征选择方法。但凡是特征选择,总是在将特征的重要程度量化之后再进行选择,而如何量化特征的重要性,就成了各种方法间最大的不同。开方检验中使用特征与...
2018-11-13 13:58:25
1171
原创 HTTP基础知识(仅介绍涉及R语言爬虫部分)
说明:本文参照Simon Munzert著&吴今朝译的《基于R语言的自动数据收集》一书,进行个人二次整合而成,如有侵权,告知后删。(一)HTTP基础知识1、HTTP定义HTTP(HyperText Transfer Protocol)意为超文本协议,本质上是网络客户端(如浏览器)和服务器(对请求进行响应的计算机)之间进行通信的协议,通信内容包括客户端从服务器获取几乎任何类型的资源(如文本、...
2018-05-13 15:09:18
2434
原创 HTML基础介绍(仅介绍涉及R语言爬虫部分内容)
说明:本文参照Simon Munzert著&吴今朝译的《基于R语言的自动数据收集》一书,进行个人二次整合而成,如有侵权,告知后删。之所以要讲讲HTML的基础知识,是基于目前网络爬虫主要爬取源格式为HTML,本着知己知彼的心态,整理了HTML在爬取数据中需要知道的一些小知识点,以供后用。本文涉及的案例均可在以下链接中找到,http://www.r-datacollection.com/mat...
2018-05-06 00:56:23
2868
原创 Titanic数据分析与可视化
前言:跟Kaggle上大师们做的第一个项目,记录下目前的心得体会,便于后续查阅。 泰坦尼克沉船事故已经过去多年,但是关于它的生存预测问题一直是数据分析与建模的经典案例,今天抽空把Chuck Talbert大师做的预测进行简单翻译和再现,并加入个人理解,原文链接:Titanic: A TidyCaret Approach - (0.8086)开始数据分析与建模之前,我们一起看看Titanic数据集字...
2018-05-05 15:48:55
6390
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人