自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

Cara的博客

保险行业的数据爱好者

  • 博客(5)
  • 收藏
  • 关注

转载 SVM入门

至今见过介绍SVM最好的博文,全文分享~http://blogjava.net/zhenandaci/archive/2009/02/13/254519.html(一)SVM的八股简介支持向量机(Support Vector Machine)是Cortes和Vapnik于1995年首先提出的,它在解决小样本、非线性及高维模式识别中表现出许多特有的优势,并能够推广应用到函数拟合等其他机器...

2018-11-13 14:01:44 238

转载 信息增益介绍

优秀博文,全文转载:http://www.blogjava.net/zhenandaci/archive/2009/03/24/261701.html前文提到过,除了开方检验(CHI)以外,信息增益(IG,Information Gain)也是很有效的特征选择方法。但凡是特征选择,总是在将特征的重要程度量化之后再进行选择,而如何量化特征的重要性,就成了各种方法间最大的不同。开方检验中使用特征与...

2018-11-13 13:58:25 1171

原创 HTTP基础知识(仅介绍涉及R语言爬虫部分)

说明:本文参照Simon Munzert著&吴今朝译的《基于R语言的自动数据收集》一书,进行个人二次整合而成,如有侵权,告知后删。(一)HTTP基础知识1、HTTP定义HTTP(HyperText Transfer Protocol)意为超文本协议,本质上是网络客户端(如浏览器)和服务器(对请求进行响应的计算机)之间进行通信的协议,通信内容包括客户端从服务器获取几乎任何类型的资源(如文本、...

2018-05-13 15:09:18 2434

原创 HTML基础介绍(仅介绍涉及R语言爬虫部分内容)

说明:本文参照Simon Munzert著&吴今朝译的《基于R语言的自动数据收集》一书,进行个人二次整合而成,如有侵权,告知后删。之所以要讲讲HTML的基础知识,是基于目前网络爬虫主要爬取源格式为HTML,本着知己知彼的心态,整理了HTML在爬取数据中需要知道的一些小知识点,以供后用。本文涉及的案例均可在以下链接中找到,http://www.r-datacollection.com/mat...

2018-05-06 00:56:23 2868

原创 Titanic数据分析与可视化

前言:跟Kaggle上大师们做的第一个项目,记录下目前的心得体会,便于后续查阅。 泰坦尼克沉船事故已经过去多年,但是关于它的生存预测问题一直是数据分析与建模的经典案例,今天抽空把Chuck Talbert大师做的预测进行简单翻译和再现,并加入个人理解,原文链接:Titanic: A TidyCaret Approach - (0.8086)开始数据分析与建模之前,我们一起看看Titanic数据集字...

2018-05-05 15:48:55 6390

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除