R语言-实用笔记
文章平均质量分 58
本编是R语言的搬运工,哪里需要哪里搬,搬到天涯海角
刺猬多情
公众号;刺猬多情
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
R语言dplyr包:高效数据处理函数(filter、group_by、mutate、summarise)
R语言dplyr包的数据整理、分析函数用法文章连载NO.01在日常数据处理过程中难免会遇到些难处理的,选取更适合的函数分割、筛选、合并等实在是大快人心!利用dplyr包中的函数更高效的数据清洗、数据分析,及为后续数据建模创造环境;本篇涉及到的函数为filter、filter_all()、filter_if()、filter_at()、mutate、group_by、select、summa...原创 2018-12-13 22:56:51 · 78583 阅读 · 17 评论
-
R语言高效数据处理-自定义生存分析函数笔记
A:以下自定义函数为借鉴团队的多个笔记,经过反复调试可以使用的,但部分标签位置可能不恰当,需要自定调整B:这些函数可能用不到,里面的一些数据处理函数可以借鉴C:如有疑问随时留言,看到了会解答,如果有用就很荣幸。原创 2025-10-29 23:44:16 · 338 阅读 · 0 评论 -
R语言高效数据处理-变量批量统计检验
A:以下的4个检验都会自动判断数据里面的数据类型,然后选择对应的变量作统计检验;B:检验结果中有的是捕获了检验警告信息的,帮助选择检验结果数据;C:所有检验均只返回统计检验结果数据,不判断使用哪种检验结果作为最终需要的数据,有需要这一层判断自行添加逻辑。原创 2025-10-24 10:32:17 · 519 阅读 · 0 评论 -
R语言高效数据处理-自定义格式EXCEL数据输出
注:以下代码均为实际数据处理中的笔记摘录,所以很零散在实际数据处理中为了提升效率,将Excel报表交付给需求方时减少手动调整的环节很有必要。原创 2025-03-15 22:53:01 · 893 阅读 · 4 评论 -
R语言dplyr包高效处理数据-补充函数
关于R语言中dplyr包实用函数的补充:cur_group_、add_count、cumall、cumany原创 2023-09-17 18:25:17 · 504 阅读 · 0 评论 -
R语言高效数据处理-自定义通用函数
通用函数说明#data_eg为传入的数据集,var1为传入的变量,para1、para2为传入的参数#此函数便于计算任意变量在指定的范围内的计算结果#通用函数说明#data_eg为传入的数据集,var1为传入的变量,para1、para2、para3为传入的参数,#...为传入任意变量(可以为单个变量,也可为多个)#此函数便于计算任意变量的周期数据}else{#利用上面函数,结合apply进行周期数据计算,可减少重复写同类的计算#var1,var2为...传入的变量。原创 2022-04-26 18:55:52 · 710 阅读 · 0 评论 -
R语言连接MySQL读写中文数据乱码问题解决方案
R语言在对中文的读写上是有点不友好,估计也是众多R语言使用者吐槽的点。Rstudio连接mysql可以通过RMySQL和RODBC连接,通常对于非中文的数据读写、分析都不会出现问题,但是遇到中文的时候问题就来了。对于R连接MySQL读取中文或者写入中文数据的时候乱码问题,这里给出的解决方案如下:1、通过RODBC包进行读取,可以完美解决(相对来说,odbc的连接方式比RMysql...原创 2019-05-09 18:03:09 · 3081 阅读 · 0 评论 -
R中HIVE实战
R连接hive报错:R中报错java.lang.NoClassDefFoundError: com/google/protobuf/ProtocolMessageEnumhiveserver2端报错java.lang.RuntimeException: org.apache.hadoop.ipc.RemoteException(org.apache.hadoop.security.aut...原创 2020-04-10 16:39:26 · 721 阅读 · 0 评论 -
七月与安生简约词云R语言版
R语言词云 不经意间注意到 七月与安生 这个电影,周冬雨凭借自身精湛的演技表现出普通的一对小情侣可能会经历的旅程,质朴而又韵味十足,其中不乏许多妙语,可能很多人都知道,但体会都略有所不同,自身演绎甚是美好。安生:我遇见你,所以我喜欢你,七月:我喜欢你,所以我陪伴你七月说,你写的是什么内容,安生说,流浪,爱,和宿命。 七月第一次遇见安生的那一年他十三岁,春意...原创 2018-09-07 22:26:46 · 1243 阅读 · 0 评论 -
R语言&ggplot2包连载之ggplot分面图@灵魂走风的江湖
ggplot2包运用实例—定制化绘图1、作图代码iris %>% #变量选择select(Sepal.Length,Sepal.Width,Species)%>%#图表基础数据ggplot(mapping=aes(y=Sepal.Length,x=Sepal.Width,color=Species))+#绘图方式geom_point(shape=8)+#分面函数facet_wrap(~Species)+#图形猪蹄设置theme(legend.text.align .原创 2021-08-26 14:36:08 · 499 阅读 · 0 评论 -
R语言RCurl爬虫(多线程爬虫)-高评分豆瓣图书
R语言爬虫-高评分图书(豆瓣)# R语言爬虫-高评分图书(豆瓣)本篇文章依然延续之前的爬虫类型文章,多次实操有助于对于代码的理解和技术的提升。此次爬取的是豆瓣上高评分的图书,每一次爬取都会给大家提供一份有价值、有意义的东西,每一次都有所提升,我是ERIC,希望喜欢这方面技术的或者对于发表的内容感兴趣都可以相互交流,共同提升。 (此篇爬虫数据采集后只进行了简单的可视化分析,未进...原创 2018-11-09 00:07:22 · 2869 阅读 · 6 评论 -
R语言爬虫豆瓣高评分电影TOP250抓取
豆瓣电影TOP250抓取下了那么多包没用多少东西,看着黑人,反正prada prada的赶紧逃,赶紧的,你会炸的 这里面主要用到R/Rstudio里面的RCurl、XML、wordcloud、stringr、jiebaR勒几个包,熟悉的娃晓得R里面爬虫明星般的包就是RCurl和Rvset了,不过对于更强大的Rselenium、Rwebdriver什么的先不要管了,别把自己玩疯了,...原创 2018-08-31 21:30:08 · 2895 阅读 · 2 评论 -
R语言dbplyr包实现R与SQL语句无缝衔接
注:并不支持所有R函数语句转换为SQL,例如:dplyr包的with_groups1、cop_to函数适用于少量数据复制到数据库(通常创建为临时表),然后使用R语句计算并转换为SQL语句;不建议直接复制数据到库再进行操作,大量数据复制会耗费较长时间,使用src_memdb将极大节省时间(并不会创建新的数据在R中,而是存储在src_memdb)。copy_to( src_x,#远程数据源链接,例如src_postgres,src_sqlite df,#需要复制的数据 name =原创 2021-11-11 18:38:42 · 1518 阅读 · 0 评论 -
R语言data.table包高效处理/提升大数据效率@灵魂走风的江湖
data[i,j,lapply(.SD,fun),.SDcols=,by]fifelse()函数,可对照dplyr包if_else、软件内置ifelse函数计算效率大数据集(GB量)处理原创 2021-11-03 19:02:55 · 1811 阅读 · 0 评论 -
R语言dplyr包:高效数据排序函数
窗口函数均在dplyr包中,相当于深入运用,可对应SQL函数数据处理排序函数dense_rank#对数据按照日期分组后排序,从大到小排序activity_value_rank<-activity_value%>%group_by(date)%>%mutate(value_rank=dense_rank(desc(max_value)))#对数据按照日期分组后排序,从小到大排序activity_value_rank<-activity_value%>%group_原创 2021-06-17 18:47:34 · 1631 阅读 · 0 评论 -
R语言高效处理复杂数据函数汇总@灵魂体验官
#清除Rstudio中已读取、输出结果、函数等数据rm(list=ls())#设定文件读取路径setwd("E:/r_files")library(dplyr)library(stringr)library(magrittr)library(openxlsx)library(lubridate)library(Hmisc)library(docxtractr)install.packages("readtext")library(data.table)library(mice.原创 2021-01-13 18:53:41 · 1148 阅读 · 0 评论 -
R语言正则表达式语法共享(更新中)
R语言正则表达式语法在之前文章stringr包里面提到需要用到正则表达式的去处理一些杂乱数据,尤其是在处理从网络爬取的数据,而非自由平台的数据时候,数据是非常脏的。R语言可运用正则表达式的函数 1、有基础包自带函数grep, grepl, regexpr, gregexpr,regexec,sub,gsub这些函数的参数都一样grep(pattern, x, ignore....原创 2019-05-22 16:34:14 · 1327 阅读 · 0 评论 -
R语言Spark大数据分析/可视化环境配置/部署教程(sparklyr、hadoop)
R软件本身软件可以处理的数据量其实对于一些喜欢用R处理数据的有一些局限性,但是R现在也可以部署大数据环境,过程虽然比较艰辛,但结果是安逸的。最开始我们需要下载配置环境,配置环境小编把分为两部分:1、外部环境配置文件(java、spark);2、Rstudio中配置1.1java下载、安装,选择适合你系统的就可以;1.2安装好java后我们需要做的一件重要的事就是系统环...原创 2019-02-27 21:34:36 · 1817 阅读 · 0 评论 -
Hmisc包函数(变量名批量修改、变量标签、变量描述性统计)
Hmisc包函数1、upData(object, ...,subset, rename, drop, keep, labels, units, levels, force.single=TRUE,lowernames=FALSE, caplabels=FALSE, moveUnits=FALSE,charfactor=FALSE, print=TRUE, html=FALSE)函数主要参数...原创 2019-06-21 15:38:30 · 5939 阅读 · 0 评论 -
R语言data.table包高效数据处理(大量数据分析/处理)
在数据处理量较大的时候,最为头痛的就是数据的读写、运算效率。 data.table处理大数据集(数据文件达到以1G为单位)时相对于R语言的基本函数在数据读写、处理速度都不能与之相比可以对比基础函数、dplyr包函数做同样运算处理的时间。可自行对比数据处理函数(filter、group_by、mutate、summarise),数据量在上100万左右,稍微复杂的计算差距就特别明显。...原创 2019-04-07 20:38:26 · 8407 阅读 · 2 评论 -
R语言dplyr包:高效数据处理函数case_when、inner/semi_join/anti_join、right/left_join@灵魂走风的江湖
R语言高效数据处理包本篇为dplyr包实用函数的连载,主要为SQL数据库中类似功能的实现。1、case_when函数,有一些SQL基础(casewhen)的都猜得到这个函数的功能可实现多条件判断并可以添加标签的函数,这在我们对数据进行分类整理中十分的实用,这个函数中的参数可以这样分:一部分是判断条件,另一部分是所要做的标签iris%>%select(Sepal.Lengt...原创 2019-03-30 21:38:08 · 11352 阅读 · 0 评论 -
R语言stringr包字符串、文本数据处理函数(数据清洗、正则表达式)
最近一直在忙于数据清理、整理,分析、可视化都不多,想来把数据处理中的一些方法分享给大家!本篇是对你接到一个烫手山芋时,如何将它们一并拿下!stringr包函数处理脏数据可谓是屡试不爽,例如:网络爬取的数据、平台反馈数据、用户数据、医疗数据由于时间比较赶,下面写到的都是常用的数据处理函数1、最基础的就是字符串拼接函数:str_c、str_join2、数据匹配函数:inner...原创 2019-03-19 22:51:07 · 5287 阅读 · 0 评论 -
R语言tidyr包数据变换函数(dplyr包组合使用,完美)
日常的数据预处理中,不可避免的会遇到数据的各种变形、转换,R语言中的tidyr包函数解决了数据变形上的问题,变量、列的转换。1、宽数据变长数据gather(data, key = "key", value = "value", ..., na.rm = FALSE,convert = FALSE, factor_key = FALSE)参数说明:data数据; ...原创 2019-02-23 23:00:00 · 4154 阅读 · 0 评论 -
R语言dplyr包:高效数据处理函数arrange、sample_n、n_distinct、select、compute等
今天是个特别的日子,小编在这里祝大家情人节快乐!本篇文章继续之前文章提到的关于dplyr包数据处理的函数。错了,小编是准备那天发的,忘发了R语言在数据整理、分析上面的方法是很多的,并且通俗易懂,相信热衷于用R语言处理数据的同仁也深有体会。1、数据排序函数arrange()函数其实和大家经常用的EXCEL中的降序、升序相似,但该函数的功能肯定更便捷、强大,可以按照多列(有序的列)进行...原创 2019-02-16 15:14:48 · 15154 阅读 · 0 评论 -
R语言purrr包函数(map函数族)
R语言高效数据处理包purrr参数说明:x:列表或者向量;.f:函数或者公式或者向量; .p:判断函数;.else:若.p参数为false则执行该参数的函数 .at:函数只修改.at对应的参数;.l向量列表初始函数名 作用说明 对应二维列表/参数 对应多维列表/参数 map(.x,.f,......原创 2019-06-13 17:54:12 · 11071 阅读 · 0 评论
分享