
R
文章平均质量分 83
PUMC芋圆四号
临床医学从业人员
展开
-
R语言笔记-帮助文档-ggplot函数
文章目录描述基本语法``data````mapping````environment``细节描述该函数定义了一个ggplot对象。包含两层基本内容:源数据源数据中各项指标到图形特征的映射 (美学元素aesthetics)在ggplot中定义的美学元素将会应用于后续所有叠加于其上的图层中,除非图层中特别声明并进行覆盖基本语法ggplot( data=NULL, mapping=aes(), ..., environment=parent.frame() )data声明了原创 2021-01-18 18:33:59 · 3272 阅读 · 0 评论 -
R语言笔记-ggplot2-用于计数的条形图
文章目录基础条形图:``geom_bar``条形高度表示计数:``stat="count"``条形高度表示特定函数值:``stat="identity"``复合条形图堆叠计数条形图:``fill=堆叠分类变量``分立计数条形图:``position="dodge"``堆叠比例条形图:``position="fill"``基础条形图:geom_bar条形高度表示计数:stat="count"geom_bar()的参数stat声明了条形高度的含义。stat="count",高度表示计数,默认配置,无需特原创 2021-01-15 16:26:21 · 6867 阅读 · 2 评论 -
R语言笔记-日期和时间数据
文章目录日期和时间类POSIXct和POSIXlt类Date类日期和字符串的相互转换字符串转为日期:``strptime()``日期的格式化:``strftime()``日期和时间数据的运算加数值求两个日期/时间之间的差值:``difftime()``生成规律时间序列:``seq()``日期和时间类POSIXct和POSIXlt类POSIXct:存储了以世界标准时 (UTC)为准的从1970年开始计时的秒数计数返回当前日期和时间:Sys.time()POSIXct:适用于存储和计算时间POSI原创 2021-01-13 21:22:57 · 1111 阅读 · 0 评论 -
R语言笔记-ggplot2-散点图和拟合曲线图
文章目录概述散点图:``geom_point()``简单散点图带分组的散点图声明≥3个连续变量特征的散点图拟合曲线图:``geom_smooth()``同时呈现分组散点图与整体拟合图:``stat_smooth()``根据分类变量取值分别作图:``facet_grid()``概述ggplot函数data:定义待可视化的源数据mapping:定义数据到图形的映射aes:美学元素,定义图形的呈现细节geom开头的一系列函数:指定图形元素主题 (theme):主题提供了一套绘图风格,在原创 2021-01-13 20:22:39 · 39030 阅读 · 5 评论 -
R语言笔记-变量间相关性评价
文章目录连续变量间相关性计算Pearson、Spearman、Kendall相关系数:``cor(,method="")``相关系数的假设检验与置信区间检验一个相关系数:``cor.test()``检验相关矩阵下的所有相关系数:``corr.test()``偏相关:``pcor()``与``pcor.test()``分类变量间相关性独立分类变量相关性:``assocstats()``配对列联表相关性 (一致性):``kap()``示例数据:MASS包中的birthwt数据集。首先将数据集中的分类变量因子原创 2020-10-23 23:23:08 · 5287 阅读 · 1 评论 -
R语言笔记-用tableStack汇总双变量分析结果
文章目录预处理``tableStack()``用法以紧凑形式呈现:``name.test=FALSE``呈现所有变量的基本信息:``by="none"``呈现多分类变量水平下的结果将输出结果导出到csv文件示例数据:MASS包中的birthwt数据集。预处理将分类变量因子化,具体参考这里为每个变量设置标签:语法为attr(数据框名,"var.labels")<-c(按变量顺序排列的标签名)> attr(birthwt,"var.labels")<-c("low birth w原创 2020-10-22 22:25:29 · 2192 阅读 · 1 评论 -
R语言笔记-连续型变量组间差异比较
文章目录独立样本t检验方差齐性检验 (两组):``var.test()``独立样本t检验:``t.test()``非独立样本t检验单因素方差分析 (ANOVA)正态性检验:``tapply(,shapiro.test)``方差齐性检验 (多组)Bartlett检验:``bartlett.test()``Levene检验:``leveneTest()``建立单因素ANOVA模型:``aov()``事后检验TukeyHSD检验:``TukeyHSD()``其他校正方法:``pairwise.t.test()``原创 2020-10-22 21:50:31 · 8557 阅读 · 0 评论 -
R语言笔记-分类变量列联表和独立性检验
文章目录频数表与列联表的生成一维频数表二维列联表多维列联表独立性检验χ2\chi^2χ2检验相对危险度 (relative risk, RR)与比值比 (odds ratio, OR)分层情形下的独立性检验:Mantel-Haenszel检验配对列联表的一致性检验:McNemar检验示例数据:MASS包中的birthwt数据集。首先将数据集中的分类变量因子化,具体参考这里。频数表与列联表的生成一维频数表仅展现1个分类变量频数统计语法:table(数据框名$变量名)> table(bi原创 2020-10-21 22:06:46 · 11742 阅读 · 0 评论 -
R语言笔记-数值型变量的描述统计
文章目录不分亚组的描述统计使用向量操作计算单个变量的描述统计量计算汇总了多个变量的数据框的描述统计量:``sapply()````psych``包:``describe()``分亚组的描述统计``aggregate()````epiDisplay``包:``summ()````psych``包:``describeBy()``不分亚组的描述统计以MASS包中的数据集birthwt为示例。使用向量操作计算单个变量的描述统计量单个变量统计函数计算的基本语法:统计函数(数据框$变量名)关于基本统计函数原创 2020-10-21 16:55:11 · 3783 阅读 · 0 评论 -
R语言笔记-数据集信息概览
文章目录检查基本信息:``str()``将分类变量因子化:``factor()``对有序分类变量的声明:``ordered=TRUE``变量信息汇总统计基本包:``summary()````epiDisplay``包:``des()````epiDisplay``包:``summ()``以MASS包中的数据集birthwt为示例。检查基本信息:str()留意变量类型:分类变量 (是否因子化),数值变量。data(birthwt,package = “MASS”)str(birthwt)‘dat原创 2020-10-21 16:24:42 · 2647 阅读 · 0 评论 -
R语言笔记-缺失值的处理
文章目录缺失值的识别缺失值的忽略在计算中忽略缺失值:``na.rm=TRUE``删除变量存在缺失值的个案:``na.omit()``缺失值的识别缺失值表示:NA,代表not availableis.na():返回与输入对象相同格式的对象,其中元素为逻辑值,若原对象该位置为缺失值,返回TRUE,否则返回FALSEtable(is.na()):返回输入对象缺失值与有效值的统计举例如下:> M ID sex age score1 1 1 15 802 2 2 N原创 2020-10-19 22:07:09 · 7477 阅读 · 1 评论 -
R语言笔记-数据框长宽格式转换
文章目录长格式与宽格式整洁数据集的要求使用基本包进行转换:``reshape()``长转宽宽转长使用``tidyr``包进行转换长转宽:``pivot_wider()``宽转长:``pivot_longer()``长格式与宽格式长格式 (long form):一行代表一次观测,对一个对象不同时刻的观测分布在不同的行之中例如,共有m个对象,每个对象都在n个不同的时刻进行观测,共产生的mn个观测值以长格式记录如下subjecttimepointvalue111t1t_1原创 2020-10-18 23:52:53 · 5466 阅读 · 0 评论 -
R语言笔记-数据框的合并
文章目录合并个案:``rbind()``合并变量:``cbind()``按标识符合并一般数据合并``merge()``和``full_join()``指定供受体数据框的数据合并:``left_join()``和``right_join()``合并个案:rbind()rbind(数据框1,数据框2):合并数据框1、2的所有行要求合并的数据框必须有相同的变量常用于合并个案合并变量:cbind()cbind(数据框1,数据框2):合并数据框1、2的所有列要求合并的数据框必须有相同的个案常用于原创 2020-10-18 23:03:20 · 25002 阅读 · 0 评论 -
R语言笔记-用dplyr包处理数据框
文章目录安装``dplyr``包筛选个案:``filter()``和``slice()````filter()````slice()``排列个案:``arrange()``选择特定变量构成新的数据框:``select``增加变量与更新变量:``mutate``增加变量 (计算为新变量)更新变量 (计算并覆盖)计算统计量:``summarise``拆分数据框:``group_by()``传递符:``%>%``将``group_by()``和``summarise()``结合在一起实现分组统计安装dpl原创 2020-10-18 22:27:30 · 774 阅读 · 0 评论 -
R语言笔记-用基本包处理数据框
查看数据框内容函数解释head()显示数据集前几行tail()显示数据集后几行str()数据集概览attributes()更详细的数据集信息查看des()数据集中变量基本信息查看以epiDisplay包下的Familydata数据集为例:> library(epiDisplay)> data("Familydata")直接输入数据框名称:等价于使用print()函数对于比较大的数据框,会占用很多屏幕head(som原创 2020-10-18 00:04:09 · 1342 阅读 · 0 评论 -
R语言笔记-获取、导入与导出数据
从内置数据集获取数据内置数据集存在于各个包中基本包datasets中包含各个领域的100多个数据集,可使用data()函数进行查看data(package="datasets")调用数据集到工作空间:data(数据集名称)查看数据集的帮助:help(数据集名称)调用不在内存之中包的数据集时,需要先加载该包到内存之中# e.g.> library(MASS)> data(package="MASS")> data(bacteria)> bacteria模拟原创 2020-10-17 21:41:55 · 3288 阅读 · 1 评论 -
R语言笔记-R的数据结构:向量,因子,矩阵,数组,列表,数据框,数据类型转换
向量 (vector)用于存储数值型、字符型、逻辑型数据的一维数组。建立向量枚举A<-c(1,2,3,4,5)数值序列A<-seq(from=1,to=10,by=2) # 以2为步长,从1起始到10结束同值重复A<-rep("HUAWEI",times=5) # "HUAWEI"重复5次选取向量元素/子集单个元素A[k] # 选取向量A中第k个元素选取部分元素构成的子向量A[子向量序号构成的向量B] # 选取向量A中序号为向量B中元素的向量# e.g.原创 2020-10-17 19:02:11 · 4340 阅读 · 0 评论 -
R语言笔记-R的安装,包的概念,基本数学计算,对象和工作空间
R的安装安装R安装RStudioRStudio是目前最受欢迎的R语言图形界面编辑器之一包 (packages)包的安装R:程序包->安装程序包,选择镜像,选择包,即可RStudio:右下角Packages->Install加载包到内存中:library()或require()检查内存中是否已加载目标包:search,然后检查packages中有没有更新包RStudio:Packages->Updateupdate.packages()基本原创 2020-10-17 00:22:57 · 401 阅读 · 0 评论