- 博客(26)
- 收藏
- 关注
原创 利用processR软件包实现简单的中介效应模型
中介效应旨在探讨自变量(Independent Variable, X)通过中介变量(Mediator, M)对因变量(Dependent Variable, Y)的间接影响机制。它不仅关注直接效应(X→Y),还试图揭示潜在的心理或行为机制(中介效应解释了一个变量通过何种机制来影响另一个变量。中介效应通常通过路径分析或回归分析来检验,它帮助揭示了两个变量之间的关系的中间步骤或中介步骤。中介效应模型探讨的是一个变量(自变量,X)如何通过另一个变量(中介变量,M)影响结果变量(因变量,Y)。
2024-11-25 20:09:58
985
原创 初遇Python-----python/anaconda/PyCharm安装应用问题
本文主要讲一下python/anaconda/PyCharm安装和应用的问题。
2024-11-14 20:22:59
964
原创 R语言数据清理--little tips & 泛函数的应用
最近在清洗调查数据时候,发现了几个之前未曾应用的数据清理小技巧,在此一一和小伙伴们分享一下经验,也算是做一下记录,留备后期回顾学习。
2024-10-17 17:59:19
485
原创 【Office AccessDatabase Engine 安装错误解决】
Office AccessDatabase Engine 安装错误解决
2024-08-15 16:45:12
4639
1
原创 心脑血管疾病超额死亡分析——基于低温寒潮影响
近期低温寒潮天气再度来袭,不知道大家有没有感受到,近年来我国寒潮天气发生频次逐渐增加。环境温度,是影响心血管健康的一个重要因素。在体温调节的控制下,我们的体温总是基本恒定的。大约在25℃时,我们体内的毛细血管舒张平衡,感觉非常舒适。而较大幅度的气温下降对心脑血管健康不利,冷空气活动会明显导致心脑血管疾病发生、加重甚至死亡风险。因此在工作或科研中总是会考虑到低温寒潮到底会造成心脑血管疾病多大程度的影响,故引入了超额死亡的研究方法。
2024-02-02 10:47:17
242
原创 基于GBD数据绘图之——热力图
日常工作中,热力图可以直观地表现数据的分布情况,通过颜色的深浅和亮度的变化,可以让人更好地理解数据密集程度和趋势。尤其是在公共卫生领域,对于大样本量流行病学数据进行更好且直观的可视化展示。
2023-11-06 17:37:31
892
1
原创 基于GBD数据绘图之——双Y轴图
GBD数据库由美国华盛顿大学健康测量和评价研究中心 ( Institute for Health Metrics and Evaluation ,IHME )的全球疾病负担( GBD )项目研究组牵头建立,提供了自 1990 年以来全球 204 个国家和地区的 369种疾病、伤害和健康危险因素的流行病学数据 ,并定期对数据库进行更新发布。近期对疾病负担研究颇感兴趣,在日常监测数据中也会经常用到,查阅了一系列paper,发现一张精美的图片,能将分析数据完美、直观的展示。本期文章就GBD数据进行双Y轴图的绘制。
2023-10-24 17:15:31
1358
原创 【R语言-基于“periodR”包进行生存分析】
生存率的计算方法有多种形式,以纳入诊断时间和随访日期的差异可分为队列法、完全法、现时法和预测法等。本文运用“periodR”包进行多种生存分析方法的比较。
2023-06-26 16:02:26
843
2
原创 【R语言-生存分析之相对生存率计算】
由于人群的肿瘤登记工作中死亡患者通常由生命统计系统推送或者在基层工作者随访中发现, 患者的根本死因资料可信度不高,因此,以人群为基础的生存资料分析中通常用相对生存估计法计算净生存率。
2023-04-13 15:22:57
1531
原创 【R语言-生存分析之观察生存率计算】
全人群肿瘤登记资料常用的统计分析指标包括发病率、死亡率、现患率以及生存率等,其中肿瘤生存率是评估肿瘤治疗效果和肿瘤负担的必要指标,其计算涉及肿瘤患者的发病、 死亡和随访三个方面的资料, 数据整理和计算过程均较为复杂, 如何及时、 准确地计算肿瘤生存率, 并使其可以在不同地区、 不同人群、不同时期间被客观公正地比较和评价,仍然是统计学家们一直在研究的主题。
2023-04-13 15:03:45
4598
2
原创 ARIMA模型构建
ARIMA(autoregressive integrated moving average model)模型由Box与Jenkins于上世纪七十年代提出,是一种经典的时间序列预测模型。
2023-03-03 17:31:01
972
原创 时间序列模型分类及应用
时间序列本质上反映的是某个或者某些随机变量随时间不断变化的趋势,从数据中挖掘出这种趋势变化规律,并利用其对将来的数据做出估计和预测。其可以反映社会经济现象的发展变化过程,描述现象的发展状态和结果;可以研究社会经济现象的发展趋势和发展速度;可以探索现象发展变化的规律,对某些社会经济现象进行预测。一直以来在金融领域(股票走势、期货价格等)应用较为广泛,近年来在医疗卫生领域,传染病发病、非传染病健康结局指标等方面发挥越来越重要作用。
2023-03-03 16:14:03
2250
原创 R语言连接外部数据库
数据库管理系统在日常监测数据收集、质控过程中发挥着重要作用,access数据库存储方式简单,界面友好,操作简便,在处理数据过程中能够极大提高效率。但是将大批量数据导出为excel,到R软件中进行一系列统计分析时,导出速度较慢,极易卡顿。有没有一种方式能够直接用R调用access数据库呢,RODBC包应运而生。...
2022-07-11 17:18:47
691
原创 【R语言 南丁格尔玫瑰图绘制】
继续上一篇地理信息可视化讲起,为了能够更加直观的展示数据分布情况,发现之前人民日报客户端曾经做过一张关于疫情分布的玫瑰图,非常惊艳,故尝试用当前爬取的数据进行绘制。绘图前数据整理现存数据中不少地区病例已经清零,故在绘图中剔除为0的地区,由于弯弯的数据太过于扎眼,和大陆地区差异巨大,直接用原始数据绘图可视化较差,故对原始数据进行了相应调整。library(ggplot2)library(RColorBrewer)library(dplyr)###绘图数据处理###mydata[,c(1,3)]%
2022-05-28 13:58:37
2127
1
原创 【R语言】地图信息数据可视化
最近需要对国内疫情分布情况绘制可视化地图,查找资料R中地图绘制思路,显示在R中绘制地图主要有三种方式:第一种是利用某些特定R包中自带的地图数据进行绘图;第二种从其他途径获取地理信息数据,调用相应的软件包对数据进行读取,进而绘图;第三种是基于某些供应商的tiles与Google、NASA、高德等网络在线地图相关联,调用其地图数据为自己绘图所用。下面进行举例说明:1.【绘图前准备】爬取丁香园每日疫情数据##加载程序包,设置路径##setwd("f://data")library(rvest)libra
2022-05-27 14:48:35
5147
原创 【从网上批量下载图片】
从网上批量下载图片【R语言】最近需要从国家统计局网站上下载一批统计年报数据,打开网址发现数据均是以图片形式存放,那么该如何批量获取呢,几行代码搞定。首先打开网页中国统计年鉴,点击左侧任意目录,单击右键审查元素,会在右侧栏中显示该数据图片的链接地址,通过观察发现链接地址有一定排列规律可寻:依据规律写个循环下载图片,代码如下:setwd("f://test")library(stringr)for(i in 1:9){##下载9张图片到本地test文件### url<-str_c("htt
2022-05-12 10:37:48
319
原创 R语言对数据框进行循环处理
最近遇到一个问题,需要对不同分类区域的相关研究指标进行特定的分析,因为涉及分类较多,使用循环赋值语句进行分类,直接上代码:举例:假设原始数据为由A区-J区的10个分类区域(如图);第一种方式:循环生成多个list下存放的数据集library(dplyr)library(stringr)###使用filter函数将数据转存到list数据集中###mc<-mydata$ad%>%table()%>%names()kk<-list()for(i in 1:l
2022-04-16 23:47:37
6494
原创 R语言进行随机抽样、分层抽样和系统抽样
最近在进行一项哨点监测项目,需要对监测点乡镇、学校和医疗机构分别进行人口规模排序的系统抽样、学校类别的分层抽样以及随机抽样,对比spss、excel后发现R语言中的sampling包能够得到较好的实现,直接上代码。原始抽样框如下,分别存放与excel不同的sheet中:代码部分:library(readxl)library(dplyr)library(sampling)dt<-list()for(i in 1:3){ dt[[i]]<-read_excel("x
2022-04-14 23:00:15
5347
原创 批量读取和写出excel数据#R语言#
运用R语言处理数据时总会遇到大批量excel数据读取和写入的问题,以R中的iris数据集举例,主要有以下几种形式(直接上代码):读入数据:1.将多个excel数据批量读入R环境中(读入csv格式文件为例):#将D盘data文件夹下的"setosa","versicolor","virginica"批量读入R环境下KK集中#bb<-c("setosa","versicolor","virginica")kk<-list()for(i in 1:length(bb)){
2022-04-08 23:32:35
3309
2
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人