我写的R包
文章平均质量分 73
介绍我自己写的R包相关
天桥下的卖艺者
4个R包的编写者。发布关于SPSS、R语言、stata等相关科研的文章。今后的方向聚焦于:1.机器学习和深度学习 2.各种模型算法研究 3.各种科研图形绘制 4.R语言编程和R包编写 5.数据挖掘
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
scimed函数发布,轻松完成中介分析
本文介绍了基于R语言mediation包开发的scimed函数,用于简化中介效应分析流程。该函数支持不同类型变量组合的中介分析:分类/连续中介变量与分类/连续结局变量,并自动生成结果示意图。文章演示了如何使用该函数分析求职干预研究数据,包括变量设置、协变量调整和结果可视化。特别指出中介变量需为二分类变量以避免报错,并展示了自定义变量标签功能。该工具为研究者提供了便捷的中介效应分析方法。原创 2025-12-31 11:40:08 · 149 阅读 · 0 评论 -
R语言演示对没有吸收状态的马尔科夫链分析
本文介绍了无吸收状态的马尔科夫链在医学研究中的应用。通过R语言分析模拟的肾功能状态转换数据,探讨了饮酒对肾功能恶化的影响。研究使用sci_msm包构建马尔科夫模型,计算不同时间点的状态转移概率,并可视化比较饮酒与非饮酒人群的状态转换差异。结果显示饮酒者肾功能向恶化状态转变的概率更高。文章详细展示了从数据导入、模型构建到结果可视化的完整分析流程,为医学研究者提供了无吸收状态马尔科夫链的应用范例。原创 2025-12-25 11:00:26 · 462 阅读 · 0 评论 -
R语言绘制复杂加权数据(nhanes数据)多模型生存分析决策曲线
本文介绍了如何使用R语言ggscidca包绘制复杂加权数据(如NHANES)的生存分析决策曲线。作者通过示例数据演示了单个模型多时间点和多个模型单时间点两种情况下的决策曲线分析。具体步骤包括:数据预处理、建立加权调查设计、构建Cox回归模型、模型转换以及最终绘制决策曲线。文章特别展示了如何通过cox.tcdca函数实现多模型决策曲线绘制,并支持自定义颜色设置。该扩展功能弥补了现有R包在复杂加权数据生存分析决策曲线绘制方面的不足,为研究人员提供了更全面的模型评估工具。原创 2025-12-17 09:13:55 · 493 阅读 · 0 评论 -
手把手带你复现一篇一区9分文章的新版双组森林图
交互效应森林图是SCI论文中展示亚组分析结果的重要工具。本文演示了使用R语言scitable包绘制单组和双组森林图的方法:对于连续变量使用scitb5a函数,分类变量使用scitb5b函数生成绘图数据,通过sciforest函数可视化。重点展示了双组森林图的绘制流程,包括生成未调整和调整模型的数据(tb5b1/tb5b2),使用sciforest2函数合并展示,并详细说明了如何自定义图表格式和参数设置。文章还提供了数据预处理、因子转换等关键步骤,帮助研究者高效完成符合SCI要求的交互效应可视化分析。原创 2025-12-09 09:08:32 · 821 阅读 · 0 评论 -
手把手带你复现一篇一区9.1分肌少症和马尔科夫链的文章(3)
本文详细介绍了如何复现一篇9.1分肌少症研究中表三和图四的分析过程。通过R语言对年龄分组数据进行马尔科夫链分析,展示了不同年龄组(60-70岁、71-80岁、80岁以上)的发病风险比和转移概率。重点演示了使用sci_msm函数进行协变量分析,以及probability.msm函数计算状态转移概率并绘制趋势图的方法。文章还提供了数据预处理、模型解析和可视化绘图的完整代码,为类似研究提供了可复现的技术路线。原创 2025-12-02 09:00:54 · 346 阅读 · 0 评论 -
手把手带你复现一篇一区9.1分肌少症和马尔科夫链的文章(1)
本文介绍了一篇9.1分肌少症研究文章,通过马尔科夫链分析肌少症状态转变模式。文章首先说明肌少症是与年龄相关的肌肉量和功能丧失,可能导致残疾和死亡等不良后果。研究选取了CHARLS数据库中4000多名60岁以上患者的肌少症数据,分两步进行:提取肌少症指标和使用马尔科夫链分析。作者详细演示了如何利用自定义的R函数charls.sarcopenia从2011、2013和2015年数据中提取肌少症相关指标(包括肌少症诊断、可能肌少症、骨骼肌质量等),为后续分析做准备。下期将继续介绍马尔科夫链分析方法。原创 2025-11-18 09:38:44 · 456 阅读 · 0 评论 -
sciml包sciababoot函数发布,轻松完成机器学习ababoost分析
数据变量很多,我解释几个我等下要用的,HBP:是否发生高血压,结局指标,AGE:年龄,是我们的协变量,BMI肥胖指数,FEV1肺活量指标,WEIGHT体重,“SBP”,“DBP”:收缩压和舒张压。我目前整合了多个R包,编写了sciababoot函数,可以轻松进行机器学习ababoost分析,下面我来演示一下,先导入R包和数据。使用sciababoot函数进行分析,这个函数使用很简单data这里填入数据,y这里填入你的结局变量,var填入你的研究变量。整理数据,主要是对数据检查,把分类变量转成因子。原创 2025-11-13 09:19:17 · 316 阅读 · 0 评论 -
复现一篇4分的charls文章生物年龄指数的生成方法
什么是生物学年龄(GOLD BioAge)生物年龄是指与特定日历年岁预期水平相比,衡量生物体整体功能状态的指标,以反映其总体健康状况。原创 2025-11-05 16:20:43 · 911 阅读 · 0 评论 -
R语言绘制复杂加权数据(nhanes数据)生存分析决策曲线
本文介绍了一种支持复杂加权数据生存分析决策曲线的新功能R包ggscidca。作者演示了如何使用该包分析NHANES数据,通过建立加权Cox回归模型并转化为决策曲线分析模型,成功绘制出加权与非加权情况下截然不同的决策曲线。该功能解决了传统方法无法处理复杂加权数据的问题,只需两步即可完成模型转换和曲线绘制,并支持对验证集的分析。结果表明,加权处理对决策曲线的阈值和图形均有显著影响,凸显了该功能在精准评估模型临床价值方面的重要性。原创 2025-10-27 09:04:01 · 587 阅读 · 0 评论 -
scinhanes包上线svy.cindex函数秒做nhanes数据生存分析的C指数
本文介绍了作者开发的R语言函数svy.cindex,用于计算NHANES数据生存分析的C指数。该函数基于Harrell's C-statistic原理,评估模型对个体事件风险排序的能力。文章演示了数据准备、模型构建(使用svycoxph)和函数应用过程,通过简单调用svy.cindex即可输出结果。虽然NHANES数据应用减少,但相关算法仍具研究价值。该工具简化了复杂抽样调查数据的生存模型评估流程。原创 2025-10-22 16:59:57 · 388 阅读 · 1 评论 -
R语言手搓一个计算生存分析C指数(C-index)的函数算法
【R语言手写生存分析C指数计算函数】文章介绍了如何手动实现生存分析C指数(C-index)的计算。C指数用于评估生存模型预测性能,核心是比较个体事件风险的排序一致性。作者通过构建癌症数据模型,详细演示了计算过程:1)比较可评估个体对;2)根据风险评分和生存时间判断一致性;3)处理各种特殊情况(包括删失数据)。最终手写函数计算结果(0.658)与R包标准函数验证一致。文章还指出大数据量时循环计算效率问题,并预告了复杂加权数据的C指数计算方法。该实现完整复现了Harrell's C-statistic的核心思想原创 2025-10-17 17:03:33 · 668 阅读 · 0 评论 -
R语言基于shiny开发随机森林预测模型交互式 Web 应用程序(应用程序)
数据变量很多,我解释几个我等下要用的,HBP:是否发生高血压,结局指标,AGE:年龄,是我们的协变量,BMI肥胖指数,FEV1肺活量指标,WEIGHT体重,“SBP”,“DBP”:收缩压和舒张压。这是我第一次写交互式应用函数,难免有些不足,后面应该会越写越好,除了机器学习,咱们的生存分析,列线图等都能做,后面我再写写,有什么意见和建议可以私信给我。今天给大家介绍一下我自己编写的sciml包的shiny.randomForest函数,可以轻易生成随机森林模型的交互页面,再也不怕被审稿人刁难了,哈哈。原创 2025-10-09 09:06:34 · 495 阅读 · 0 评论 -
复现一篇charls机器学习3.5分文章的不同数量特征模型能力展示图
本研究基于中国健康与退休追踪调查(CHARLS)数据,采用机器学习方法构建帕金森病诊断模型。研究通过比较不同变量数量下随机森林模型的预测性能,发现10个变量时模型表现最优(AUC=0.85)。方法学上,研究采用训练集(70%)和测试集(30%)划分,评估了包括敏感性、特异性在内的13项指标。研究创新性地展示了变量数量与模型性能的关系,为社区帕金森病筛查提供了高效的特征选择方案。复现结果表明,该方法具有良好的可操作性,不同数据集(如胆管炎数据)验证了其普适性。原创 2025-09-17 08:47:22 · 639 阅读 · 0 评论 -
重磅更新!sciclhls包发布clhls数据虚弱指数提取功能,效率提升看得见
CLHLS是中国老年健康影响因素跟踪调查数据,由北京大学主持,覆盖1998-2018年全国23个省市,包含11.3万人次调查数据,重点关注高龄老人健康。数据可用于计算虚弱指数(由40个变量组成),支持纵向分析和轨迹分析。通过R语言的clhls.frailtyindex函数可快速提取虚弱指数,并支持多年度数据分析和全变量导出。该数据与CHARLS数据库有相通性,适合双库交叉验证研究。研究团队还开发了便捷工具,简化了数据处理流程。原创 2025-09-12 09:46:35 · 547 阅读 · 0 评论 -
ggscidca包2.5版本上线,优雅绘制各种决策曲线,添加了xgboost模块
本文介绍了ggscidca 2.5版本的更新内容,该R包用于绘制临床决策曲线(DCA)。新版本优化了线条颜色、增加了自定义颜色功能,并新增了xgboost模块。文章演示了如何使用该包绘制xgboost、逻辑回归、支持向量机和随机森林等模型的决策曲线,支持单模型和多模型对比。同时展示了生存分析模型的DCA实现方法,强调数据需无缺失值。该包可与scitable等工具联合使用,为临床决策分析提供可视化支持。原创 2025-09-08 09:03:09 · 1039 阅读 · 0 评论 -
scitable包sciimp函数上线,两步即可完成数据插补
本文介绍了scitable包中的sciimp函数,该函数可简化数据插补过程。文章演示了使用mgus数据集进行多重插补和随机森林插补的两种方法,仅需两步操作即可完成。函数还能自动分析数据缺失模式、可视化插补前后数据分布,并提供了清除异常值后再插补的选项。通过plotimp函数可直观比较插补效果,确保数据分布一致性。该工具特别适合零基础用户快速完成数据预处理,为后续分析提供完整数据集。原创 2025-08-28 09:06:21 · 407 阅读 · 0 评论 -
charlsCMI函数发布,秒提取charls数据心脏代谢指数(CMI)
心脏代谢指数(CMI)是反映肥胖和血脂的新型指标,研究表明其与糖尿病及多种慢性病显著相关。本文介绍了CMI的计算方法,并利用CHARLS数据开发了专用提取函数charlsCMI,通过ggexplore工具快速挖掘CMI与其他变量的关联性。结果显示CMI与TYG、高血压等代谢指标显著相关(P<0.05),为研究者提供了高效的数据分析途径。该工具简化了CMI相关研究流程,有助于发现潜在的健康关联因素。原创 2025-06-19 09:15:52 · 741 阅读 · 0 评论 -
复现一篇16分的seer数据库文章:列线图风险评分+最佳阈值风险分层+生存分析曲线
摘要:列线图(诺莫图)是一种基于多变量回归分析的预测工具,通过直观的图形化评分系统预测临床结局或疾病风险。近年来在高质量临床研究中广泛应用,尤其在SEER数据库分析中。本文以一篇16分SCI论文为例,展示了如何使用列线图建立风险预测模型(包括变量筛选、模型构建和可视化),并通过最佳阈值划分低、中、高风险组,最终用KM曲线验证分层效果。分析使用R语言实现,涵盖逐步回归、风险分数计算、截点优化和生存分析全流程,为临床预测模型研究提供了可复现的方法学框架。文中还探讨了限制性立方样条(RCS)等替代方法的适用性。原创 2025-06-16 09:30:20 · 1091 阅读 · 0 评论 -
sciml包随机森立函数scirandomForest发布,轻松完成随机森林分析
本文介绍了sciml包中集成的随机森林分析方法scirandomForest。该方法基于randomForest包进行封装,可一键生成随机森林模型及其可视化结果,包括变量重要性排序、SHAP解释、ROC曲线和决策曲线等。文章通过胆管炎数据演示了该函数的使用流程,展示了模型训练、结果解读和验证集评估的全过程。该工具包还支持与其他模型(如逻辑回归)的性能比较,为机器学习分析提供了便捷的解决方案。未来计划扩展支持更多机器学习算法。该方法简化了随机森林分析流程,有助于提高科研效率和结果可解释性。原创 2025-05-30 09:31:14 · 513 阅读 · 0 评论 -
scimp包2.2版发布,增加charls地图拼音省名和图例百分比表示
CHARLS(中国健康与养老追踪调查)是一项针对中国大陆45岁及以上人群的全国性追踪调查,旨在构建一个高质量的公共微观数据库,涵盖社会经济和健康状况等多维度信息,以支持老龄科学研究。该调查参照国际老龄研究标准,如美国的HRS,确保数据的国际可比性。自2011年基线调查以来,已进行了多轮追踪调查,并在2020年增加了新冠疫情相关信息的采集。为便于数据可视化,开发了scimp包中的charlsmap函数,支持快速绘制中国省市级地图,并提供了多种自定义选项,如省名拼音显示、比例调整、图例标题修改及多颜色配置,帮助原创 2025-05-14 09:03:24 · 626 阅读 · 0 评论 -
Scitable包+ggscitable包手把手带你复现一篇3.8分charls潜轨迹模型(GBTM)文章
本文复现了《固体烹饪燃料使用与衰弱轨迹之间的关联:来自中国全国队列的结果》一文的研究,探讨了固体燃料使用与衰弱轨迹之间的关系。研究基于中国全国队列数据,通过潜轨迹模型(GBTM)分析虚弱指数的变化轨迹,并将其分为四类:低水平组1、低水平组2、快速升高组和缓慢升高组。研究结果显示,使用固体燃料与虚弱指数的快速增长显著相关,而清洁能源的使用则与缓慢增长相关。复现过程中,作者使用了R语言进行数据处理和模型拟合,并通过基线表和逻辑回归模型验证了研究结果。复现结果与原研究基本一致,进一步支持了固体燃料使用对健康的负面原创 2025-05-12 09:06:52 · 1458 阅读 · 0 评论 -
Scitable包charlscognition函数发布,秒提取charls数据中的认知功能(痴呆)数据
先提取2011年的,要先生成2011年数据,其实主要是要demographic_background,health_status_and_functioning,health_care_and_insurance这三个,我这里直接沿用既往代码了。CHARLS数据中有个变量就是认知功能(痴呆)的评分,再医学和社会学很多文章用得到,但是这个指标需要手工提取,目前我编写了charlscognition函数,可以很方便的提取出认知功能(痴呆)的评分。可以提取2011-2018年的认知评分数据。原创 2025-05-08 08:48:24 · 988 阅读 · 0 评论 -
重磅更新!Scitable包发布charls数据虚弱和虚弱指数提取功能,效率提升看得见!
但是也是相当复杂的,29个变量中,有些变量计算非常复杂,比如说认知功能,而且每一波的有些指标会变化,等于每个年份都要校对一遍,这个工作量想想都大,我也是校对变量校对到想吐了。在上图文章中,可以看到这篇文章虚弱有5个指标定义,是个2分类变量,在本篇文章中虚弱是个结局变量,也有部分文章把它用作观察变量,查看和死亡或者其他结局的关联。虚弱和虚弱指数自己手动算还是比较麻烦的,特别是虚弱指数,光找变量就有得你找的,但是用我写的函数可以很轻易做出来,下面我来演示一下,以2011年基线表为例子。原创 2025-04-25 15:18:38 · 1884 阅读 · 0 评论 -
scitable包+sciml包手把手带你复现一篇8.5分charls机器学习文章
这是一篇去年的比较新的文章,我查了下大概8.5分,文章大概就是介绍一种指数,叫做:甘油三酯葡萄糖-腰身高比指数(cumulative_TyG_WHtR),研究甘油三酯葡萄糖-腰身高比指数和新发心血管疾病的关系,作者搞了个K值聚类分析来把cumulative_TyG_WHtR指数分类,研究分类后指标和心血管疾病关系,这样类似的指数还有很多,比如TYG,WHtR,TyG_WHtR,目前这是一个发文的方向,这样的指数,变一个结局变量,又可以继续搞一篇文章,很多类似文章层出不穷,nhanes也有很多,原创 2025-04-17 09:45:16 · 1245 阅读 · 0 评论 -
生存分析时时P值不显著?生存曲线交叉怎么办?ggscitable包完美复现顶刊(柳叶刀)landmark分析
作者使用了k-m曲线,发现两个支架的不良事件无明显区别,P=0.40, 但是作者发现在12个的时候,两条曲线还是分得比较开的,有可能在0-12个月这段时间,两条曲线时有区别的。数据变量很多,我解释几个我等下要用的,HBP:是否发生高血压,结局指标,AGE:年龄,是我们的协变量,SEX:性别,OCCU.NEW这个我也不知道时什么,反正是个2分类变量。我们可以看到在30岁这个位置,两条曲线还是分得比较开的,有可能在0-30岁这个区间两个支架的不良事件结局时有区别的,所以我们可以把节点设置为30。原创 2025-04-10 09:07:14 · 1674 阅读 · 0 评论 -
ggscitable包通过曲线拟合深度挖掘一个陌生数据库非线性关系
很多新手刚才是总是觉得自己没什么可以写的,自己不知道选什么题材进行分析,使用scitable包+ggscitable包后这个完全不用担心,选题多到你只会担心你写不完,写得不够快。刚才咱们定义的是结局变量,看哪个变量和结局又关系,我们也可以定义观察变量X变量,看哪个变量和X有关系。这个是个来自私人创建的医院内部数据库,我一个朋友的,变量我就不解释了,这个数据有141个变量,605个数据。这个数据中有个TYG指数(甘油三酯葡萄糖指数),假设我想看哪个结局和这个指数相关,前面的整理数据步骤都是一样的。原创 2025-04-02 17:03:15 · 645 阅读 · 0 评论 -
R语言基于ggscitable包复现一篇3.5分的文章的连续变量交互效应(交互作用)的可视化图
交互作用效应(p for Interaction)在SCI文章中可以算是一个必杀技,几乎在高分的SCI中必出现,因为把人群分为亚组后再进行统计可以增强文章结果的可靠性,进行可视化后可以清晰的表明变量之间的关系。Death是结局变量,其他的都是一些协变量,假设我想研究年龄和死亡的关系,想知道肌酐和年龄有没有交互作用。默认的Y轴是log(P),如果你想表示为概率也可以转换,我们可以看到右边这个轴的概率明显不同了。下面绘制3D效果图,这个是你的电脑速度而定,我的电脑是有点慢,差不多要30秒。原创 2025-03-21 11:28:44 · 1101 阅读 · 0 评论 -
scimap1.9版本charls地图包发布,增加了显示省名字和小图功能
我目前专门编写了一个scimp包,目前只有一个charlsmap函数,顾名思义,这个是一个专门用于绘制charls数据地图的函数,但并不是说它只能绘制charls地图,基本中国省市级地图都能绘制,目前此包已经省级到1.8版,增加了显示省名字和小图功能,CHARLS 是一项具备中国大陆 45 岁及以上人群代表性的追踪调查,旨在建设一个高质量的公共微观数据库,采集的信息涵盖社会经济状况和健康状况等多维度的信息,以满足老龄科学研究的需要。小图的位置,大小都是可以调整的,我这里简单调整一下。原创 2025-03-11 10:12:45 · 705 阅读 · 0 评论 -
R语言使用scitable包交互效应深度挖掘一个陌生数据库
我们知道男性不可能痛经的,但是男性喝酒可能尿酸又高,你的数据中要是男性过多的化就会对结果造成影响,因此,性别就是一个混杂因素,性别分层以后就能得到女性尿酸和痛经的关系,等于是个消除混杂的处理。做了交互效应分析以后,咱们发现两个问题,虽然"Q1432"和结局并无关联,但是再Q27278这个亚组,当Q27278等于0的时候,"Q1432"和结局是线性相关的,理论上有一个亚组相关就可以写一篇文章。这个是个来自私人创建的医院内部数据库,我一个朋友的,变量我就不解释了,这个数据有141个变量,605个数据。原创 2025-03-07 09:09:01 · 1376 阅读 · 0 评论 -
scimp包1.7版发布,用于绘制charls加权地图
在文章《scimp包发布,轻松秒绘制charls数据文章中的地图》中,咱们已经介绍了scimp包绘制chalrs地图,但是由粉丝提出,地图要加入权重,不然人数太少了,不符合实际情况,我想了一下,确实如此,因此在1.7版加入了权重参数,下面我来演示一下。上图咱们可以看到,虽然按比例显示了吸烟患者的分布,但是一个省的吸烟人数才几百例,显然不符合实际情况,因此咱们可以给他加上一个权重。数据是我自己提取的charls2011年的基线表数据,我们可以看到有城市,和省的变量分布。这样就相对合理多了。原创 2025-02-24 11:58:40 · 626 阅读 · 0 评论 -
scimp包发布,轻松秒绘制charls数据文章中的地图
我目前专门编写了一个scimp包,目前只有一个charlsmap函数,顾名思义,这个是一个专门用于绘制charls数据地图的函数,但并不是说它只能绘制charls地图,基本中国省市级地图都能绘制,肯定没有其他的专业地图绘制包专业和功能详尽,但是可以快速出图,目的可以帮助新手小白快速出图,节省你的时间。假设我是有研究对象的,我想研究吸烟者在全国的分布,这里我要说一下,scimap包接受两种数据格式,一个时0和1格式,就是是否吸烟。Charlsmap函数的格式如下,data就是你的研究数据,x是研究变量。原创 2025-02-21 09:43:24 · 1090 阅读 · 0 评论 -
ggscitble包发布,新手也能玩转广义可加混合模型(2)
这个数据是从网上搞来的,应该是个模拟数据,变量我也不懂是什么意思,但是不重要,x是我们的研究变量,y是结局变量,id是我们的随机效应项,和广义可加模型不同gamm需要指定type和id,因为type默认是gam模型,当年做gamm的时候需要指定一下,id这个随机效应项一定有,不然就会报错。咱们研究的是随着时间发展,癌症死亡数的变化特点,这里选了国家做随机项,表明参考了不同国家的死亡率,然后做了总体评估。最后可以得出结论,考虑了不同国家的情况,不管是有钱的还是没钱,随着时间推移,肿瘤死亡率增加。原创 2025-02-17 09:06:37 · 1178 阅读 · 0 评论 -
ggscitble包1.3版发布-新手也能轻松玩转广义可加模型(1)
我写函数的第一准则就是要力求它的准确性,为此过年期间又把RCS和光滑样条的原理和公式都学习了一遍,还专门写了一篇RCS的原理,我见国内目前很少有人说RCS原理,唯一的一两个也说得不怎么对,如果感兴趣的人多,我也可以讲讲这方面内容。我们先来看看数据的构成,death:死亡人数 (per day),pm10:大气污染物pm10的中位数值,pm25median,o3median:二氧化硫的中位数值,time:天数,这里就是我们的时间,tmpd:华氏温度,date:日期。公众号回复:体检数据,可以获得数据。原创 2025-02-12 14:48:20 · 1121 阅读 · 0 评论 -
ggscitable包发布--一键生成1篇3.8分文章的亚组交互效应图
age表示年龄,pathsize表示病理肿瘤大小(厘米),lnpos表示腋窝淋巴结阳性,histgrad表示病理组织学等级,er表示雌激素受体状态,pr表示孕激素受体状态,status结局事件是否死亡,pathscat表示病理肿瘤大小类别(分组变量),ln_yesno表示是否有淋巴结肿大,time是生存时间,后面的agec是我们自己设定的,不用管它。这里我指出一下,函数默认是做有交互影响的结果,如果你不考虑交互影响,只是看每组的分类情况,我们可以关掉交互效应。所以考虑与否交互效应,结论还是稍微不同的。原创 2025-01-23 17:05:59 · 1381 阅读 · 0 评论 -
相加交互效应函数发布—适用于逻辑回归、cox回归、glmm模型、gee模型
下面咱们正式进入今天的主题,scitable包支持逻辑回归,cox回归,广义线性混合模型(glmm),广义估计方程(gee)的相加交互模型计算,下面我一一演示一下。Education:教育程度,age:年龄,parity产次,induced:人流次数,case:是否不孕,这是结局指标,spontaneous:自然流产次数。看到这个你可能会说,这是什么呀,我知道你很懵逼,但是请你先别懵逼,我继续演示,等会再解释,绘制森林图。有一些变量是分类变量,我们需要把它转换一下,我人为把年龄分成3段,好方便演示。原创 2025-01-10 09:01:53 · 2271 阅读 · 0 评论 -
scitable包sciroc曲线发布,新手小白也能驾驭各种roc曲线绘制—内部验证/外部验证/重抽样roc等
scitable包是我自己编写的,集合众多函数的一个R包,目前升级到3.1版,升级了sciroc曲线发,这个函数是专门为了制作各种ROC曲线的而编写的,下面我来演示一下。Education:教育程度,age:年龄,parity产次,induced:人流次数,case:是否不孕,这是结局指标,spontaneous:自然流产次数。导入R包和数据, 我们使用人流后导致不孕的数据集(关注公众号后回复:不孕症,可以获得数据),我们先导入看一下。重抽样ROC,这个一般在本数据集就可以了,原创 2025-01-04 09:47:08 · 430 阅读 · 0 评论 -
scitable包3.0版更新,增加了新的森林图绘制函数sciforest,用于一键生成森林图
sciforest函数依托于forestploter包,所以这个包必须安装。下面我来简单简单演示一下,scitable包3.0版更新,增加了新的森林图绘制函数sciforest,用于一键生成森林图。如果你比较熟悉森林图绘制,也可以自己做个模板,我这个只是演示用。有很多参数可以微调,比如我增加一个范围。先常规操作一下生成一个亚组数据。然后把模板加进去就可以了。原创 2024-12-31 09:11:47 · 603 阅读 · 0 评论 -
代码+视频,使用scitable包对charls数据快速挖掘
2019 年底到 2020 年初,新冠疫情在中国爆发,为及时记录新冠疫情对中国中老年人生活和健康的影响,在 2020 年的第 5 轮调查中增加采集了疫情相关的信息。CHARLS 是一项具备中国大陆 45 岁及以上人群代表性的追踪调查,旨在建设一个高质量的公共微观数据库,采集的信息涵盖社会经济状况和健康状况等多维度的信息,以满足老龄科学研究的需要。这个数据有36个变量,其中Frailty是结局变量,今天咱们就以Frailty为结局,看看那些变量和它有关联。提取整理好的数据和分类变量。咱们先把所有变量导出来。原创 2024-12-26 09:42:38 · 1915 阅读 · 0 评论 -
scitable包轻松复现SCI论文中的多模型亚组表格
在SCI文章中,交互效应表格(通常是表五)能为文章锦上添花,增加文章的信服力,增加结果的可信程度,还能进行数据挖掘。什么是亚组,通常就是特殊类型人群,比如男女,种族等,就是说你的数据放入特殊人群中结果还可靠吗?如果在各个特殊人群中,你的结果很稳定,说明你的结论很可靠。如果亚组的结论和你的数据数据结论相反,你可以拿来做个新论题。还可以比较不同亚组之间有无区别,比如做了心脏支架和没做支架的区别,可以发现很多新思路,易于数据挖掘。scitable包轻松复现sci论文中的多模型亚组分析。原创 2024-12-18 14:49:25 · 739 阅读 · 0 评论 -
scitable包手把手带你复现一篇预测模型的charls文章
为利用国际上最佳的数据采集方式,并确保研究结果的国际可比性CHARLS 参照包括美国的健康与退休研究(HRS)在内的系列国际老龄调查研究开展调查设计。CHARLS 是一项具备中国大陆 45 岁及以上人群代表性的追踪调查,旨在建设一个高质量的公共微观数据库,采集的信息涵盖社会经济状况和健康状况等多维度的信息,以满足老龄科学研究的需要。因为它很有典型,预测模型的列线图、校准曲线、决策曲线、roc、lassso回归等都包含了,它的观察变量是二分类变量,是否糖尿病,下次再介绍一篇3分类的,玩法稍有不同。原创 2024-12-13 11:16:09 · 805 阅读 · 4 评论
分享