r语言与数据分析
文章平均质量分 57
宁静致远oTo
我是统计学专业的研究生。数理统计知识扎实;对于金融,自学了很多金融的知识,证券,基金,期货,股票,注会,精算略知一二。希望从Python和SQL入手,将理论知识与实践相结合,未来能够在互联网金融领域寻找到一份数据分析的工作。目前在上海实习,担任数据建模分析师。
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
R语言练习-利用决策树模型分析泰坦尼克生还率(1)
R语言练习-利用决策树模型分析泰坦尼克生还率(1)一、数据预处理数据来源:http://biostat.mc.vanderbilt.edu/wiki/Main/DataSets中的titanic3.csv 本文将要用到的数据列: 列名 含义 pclass 将1/2/3等舱分别保存在1/2/3 survived 是否生还 name 姓名 sex 性别 age原创 2017-12-04 14:34:02 · 2999 阅读 · 0 评论 -
R语言练习-利用决策树模型分析泰坦尼克生还率(2)
R语言练习-利用决策树模型分析泰坦尼克生还率(2)二、决策树模型使用rpart模型的原因: 泰坦尼克数据中含有NA值,使用rpart能够处理为代理变量 1、rpart决策树模型 去掉不适合的列,如name library(rpart) library(foreach) folds<-create_ten_fold_cv() rpart_result<-foreach(f=原创 2017-12-04 15:01:35 · 2387 阅读 · 0 评论 -
R语言练习-利用决策树模型分析泰坦尼克生还率(3)
R语言练习-利用决策树模型分析泰坦尼克生还率三、利用ticket识别家庭,后分析1.添加家庭号#计算各家庭成员的生还率 f$train$type<-"T" f$validation$type<-"V" all<-rbind(f$train,f$validation) ctree_model<-ctree( survived~pclass+sex+age+sibsp+parch+fare+em原创 2017-12-04 15:21:21 · 1476 阅读 · 0 评论
分享