
R语言
没人关注
诗情画意藏心底,抑郁忧伤留昨天,即使没人关注,依然心平气和研究数据分析。分析路上多寂寞,一条大道走到底。
展开
-
R语言定价-D1-NCL
collection <- read.csv('E:/03 工作代码/02 R project/风险定价/collection.csv', stringsAsFactors = F)collection <- data.table(collection)pricing.result <- merge(collection, t, by = 'transport_id')...原创 2020-03-24 21:42:26 · 248 阅读 · 0 评论 -
R语言定价-C2-other-pricing
other_input <- t[!max_platform %in% c('TAOBAO', 'TMALL') & is.na(price_level)]other_input[, target := ifelse(X4mon_per_flag == 1 & mob4_ever_dpd15_flag == 0, 0, ifelse(mob4_ever_dpd15_fla...原创 2020-03-24 21:41:48 · 324 阅读 · 0 评论 -
R语言定价-C1-pricing_merge
# pricing strategy mergeinput_features <- c('decision_credit_type', 'initial_amount', 'sys_limit' , 'decision_qrt' , 'mob6_ever_dpd30_flag' ...原创 2020-03-24 21:41:08 · 431 阅读 · 0 评论 -
R语言定价-B6-oversea-pricing
##外贸oversea_input <- mergeData_credit[platform == 'Oversea']oversea_input[, target := ifelse(X4mon_per_flag == 1 & mob4_ever_dpd15_flag == 0, 0, ifelse(mob4_ever_dpd15_flag == 1, 1, -1))]...原创 2020-03-24 21:40:22 · 765 阅读 · 0 评论 -
R语言定价-B5-jd-pricing
jd_raw <- read.csv('E:/03 工作代码/02 R project/风险定价/df_jd_features.csv', stringsAsFactors = F)jd_raw <- data.table(jd_raw)jd_input <- merge(jd_raw, mergeData_credit, by = 'transport_id')j...原创 2020-03-24 21:39:31 · 229 阅读 · 0 评论 -
R语言定价-B4-Twofire-pricing
library(jsonlite)library(data.table)## 读入二维火数据twodfile_raw <- read.csv("E:/03 工作代码/02 R project/风险定价/2dfile_features.csv", stringsAsFactors = F)twodfile_raw <- data.table(twodfile_raw)test_...原创 2020-03-24 21:38:54 · 185 阅读 · 0 评论 -
R语言定价-B1ali-pricing
# 风险定价# step 1 淘系定价## 淘系的平台数据ali_raw <- read.csv('E:/03 工作代码/02 R project/风险定价/阿里平台数据-201904.csv', stringsAsFactors = F)## 淘系新评分-201905, 2017年1月至2019年2月进件的评分ali_newscore <- read.csv('E:/03...原创 2020-03-24 21:36:02 · 253 阅读 · 0 评论 -
R语言定价-A2variableAnalysis
## single variable analysiswoe_decile_qrt <- data.table()result_qrt <- data.table()for (name in names(pricing.merge_data)) { print(name) for (date in unique(pricing.merge_data$decisio...原创 2020-03-24 21:35:16 · 210 阅读 · 0 评论 -
R语言定价-A1sourceData
# 共同数据源输入library(data.table)library(rpart)library(rpart.plot)library(sqldf)library(reshape2)library(jsonlite)repay_raw <- read.csv('E:/03 工作代码/02 R project/风险定价/还款数据-201904.csv', stringsAs...原创 2020-03-24 21:33:53 · 244 阅读 · 0 评论 -
R语言--for循环语句的使用
R语言for循坏语句的使用(多个for)对于多个for循还语句,R语言的执行顺序(以3个for为例):从外向内单个执行,里边循还完整,再往外一层,直到全部完成。话不多说,上例子:代码:m<-c(1,2,3,4,5)n<-c('a','b','c','d','e')o<-c(6,7,8,9,10)for (i1 in m){ for ( i2 in n){ ...原创 2019-11-02 19:49:19 · 17646 阅读 · 0 评论 -
R语言-小牛试刀-用datatable进行数据的预处理
# data.table包预处理数据library(data.table)# 导入申请表app_row<-read.csv("E:/工作整理/06 analysis data/申请数据-201908.csv",stringsAsFactors=F)app_row<-data.table(app_row)# 导入所有的三方datapath<-'E:/工作整理/04 政...原创 2019-10-26 19:47:57 · 616 阅读 · 0 评论 -
R语言merge函数-数据表匹配和拼接
merge 连接两个数据merge(x, y, by = intersect(names(x), names(y)), by.x = by, by.y = by, all = FALSE, all.x = all, all.y = all, sort = TRUE, suffixes = c(".x",".y"), incomparables = NULL, ...原创 2019-10-26 19:26:06 · 1466 阅读 · 0 评论 -
R语言-赋值符号和函数
1、常用符号 <-2、在for 语句中常使用assign原创 2019-10-26 19:15:07 · 3135 阅读 · 0 评论 -
R语言列出所有变量
R语言列出所有变量ls()原创 2019-10-26 19:10:10 · 3635 阅读 · 0 评论 -
R语言字符串拆分strsplit()
R语言字符串拆分及合并字符串分割函数:strsplit()其命令形式为:strsplit(x, split, fixed= F, perl= F, useBytes= F)参数x为字符串格式向量,函数依次对向量的每个元素进行拆分参数split为拆分位置的字串向量,即在哪个字串处开始拆分;该参数默认是正则表达式匹配;若设置fixed= T则表示是用普通文本匹配或者正则表达式的精确匹配。用普通...原创 2019-10-26 17:44:52 · 40370 阅读 · 1 评论 -
R语言必学包之data.table包
版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。本文链接:https://blog.youkuaiyun.com/wltom1985/article/details/61926958 R语言具有较强的数据分析能力,但是对于数据处理,尤其是面对较大数据量时,就有很多的不足之处,为了解决处理较大数据集的问题,R中涌...原创 2019-10-26 16:30:59 · 2004 阅读 · 1 评论 -
R语言-快捷键
R语言快捷键1、注释-增加或取消 ctrl+shift+c2、执行-当前或被选中的代码 ctrl+enter 执行-整个文件 ctrl+shift+enter3、帮助 输入函数后+F1 ...原创 2019-10-26 16:30:39 · 5802 阅读 · 0 评论 -
R语言中is.na()
R语言中is.na()is.na()用于检测确实值是否存在#01-判断是否缺失> A<-c(1,1,NA,1)> is.na(A)[1] FALSE FALSE TRUE FALSE#02返回缺失值位置> which(is.na(A))[1] 3#03计算数据集A的缺失值总数> sum(is.na(A))[1] 1...原创 2019-10-23 10:30:34 · 37072 阅读 · 0 评论 -
R语言中::双冒号的作用
R语言中::双冒号的作用 要使用某个包里的函数,通常做法是先加载(library)包,再调用函数。最新加载的包的namespace会成为最新的enviroment,某些情况下可能影响函数的结果。而package name::functionname的用法,一是可以在需要用某个函数时临时直接加载包,不用事先library。另一点更重要的是尽可能减少library带来的附带作用,这一点在开发R包时...原创 2019-10-23 10:05:35 · 12790 阅读 · 0 评论 -
R语言中-findInterval()函数-做cut处理
R语言中-findInterval()函数-做cut处理findInterval (x, vec)x 为数据向量vec为一个单调递增的向量来产生区间产生的区间默认为左闭右开> x <- 2:18> v <- c(5, 10, 15)> findInterval(x, v) [1] 0 0 0 1 1 1 1 1 2 2 2 2 2 3 3 3 3&...原创 2019-10-22 20:29:49 · 3254 阅读 · 0 评论 -
R语言—决策树初探
title: “决策树”author: “yan”date: “2018年10月26日”output: html_document# 获取当前工作目录getwd()# 设置当前工作目录(改变)setwd("D:/")app=read.csv("app_tot.csv")# dim数据维度dim(app)#变量属性(int整数,num数值)str(app) #加载包l...原创 2018-11-30 18:09:16 · 299 阅读 · 0 评论 -
开始学数据分析
诗情画意留心里,沉下心来学习数据分2018年11月23日内心很复杂,健忘不是我的性格从今天起积少成多破釜沉舟循序渐进,学习数据分析啦啦啦欢迎使用Markdown编辑器你好! 这是你第一次使用 Markdown编辑器 所展示的欢迎页。如果你想学习如何使用Markdown编辑器, 可以仔细阅读这篇文章,了解一下Markdown的基本语法知识。新的改变我们对Markdown编辑器进行了一...原创 2018-11-23 18:50:42 · 271 阅读 · 0 评论