CLHLS数据库挖掘教程
文章平均质量分 73
天桥下的卖艺者
4个R包的编写者。发布关于SPSS、R语言、stata等相关科研的文章。今后的方向聚焦于:1.机器学习和深度学习 2.各种模型算法研究 3.各种科研图形绘制 4.R语言编程和R包编写 5.数据挖掘
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
手把手带你复现一篇一区9.1分肌少症和马尔科夫链的文章(2)
本文介绍了如何复现一篇9.1分的肌少症与马尔科夫链研究文章。作者使用R语言中的msm包进行马尔科夫链分析,详细展示了数据处理、基线表制作和转移概率矩阵生成过程。文章重点演示了如何从CHaRLS数据中提取指标,使用自定义函数sci_msm生成转移概率表,并尝试绘制状态转移图。虽然部分图表未能完美复现,但提供了完整的分析流程和代码实现。文章还简要解释了马尔科夫链的核心概念(状态和转移概率),为后续的表三和图四、图五复现工作做了铺垫。原创 2025-11-25 10:51:47 · 699 阅读 · 0 评论 -
重磅更新!sciclhls包发布clhls数据虚弱指数提取功能,效率提升看得见
CLHLS是中国老年健康影响因素跟踪调查数据,由北京大学主持,覆盖1998-2018年全国23个省市,包含11.3万人次调查数据,重点关注高龄老人健康。数据可用于计算虚弱指数(由40个变量组成),支持纵向分析和轨迹分析。通过R语言的clhls.frailtyindex函数可快速提取虚弱指数,并支持多年度数据分析和全变量导出。该数据与CHARLS数据库有相通性,适合双库交叉验证研究。研究团队还开发了便捷工具,简化了数据处理流程。原创 2025-09-12 09:46:35 · 546 阅读 · 0 评论 -
手把手带你复现一篇20分的CLHLS数据植物饮食指数文章
摘要:本研究基于北京大学"中国老年健康调查(CLHLS)"数据(1998-2018年),分析了植物性饮食模式与中国老年人死亡率的关系。研究采用健康植物性饮食指数(hPDI)、不健康植物性饮食指数(uPDI)和总体植物性饮食指数(PDI)评估65岁以上老年人(样本量8,780人)的饮食模式。分析方法包括基线特征比较、Cox回归模型和限制性立方样条曲线(RCS)。结果显示,较高的hPDI评分与显著降低的死亡风险相关(P<0.001),而uPDI评分与死亡风险呈非线性关系(P<0.原创 2025-07-03 09:04:58 · 1299 阅读 · 0 评论 -
聊下charls纵向数据的特点和基线表绘制
摘要:本文通过两个实际案例解释了宽数据转长数据时数据量翻倍的现象。在第一个案例中,将3种燃料类型数据合并后,数据量变为原来的3倍;第二个案例将4个年份的衰弱指数合并,数据量变为4倍。文章强调,纵向数据(面板数据)因包含多个时间点或类型,必然导致数据量增加。基线表的绘制方式取决于研究目的,可参考相关文献选择合适的数据结构。通过R代码演示了数据转换过程,直观展示了单个ID数据如何扩展为多行记录。原创 2025-07-01 09:35:28 · 1037 阅读 · 0 评论 -
sciclhls包发布,秒提CLHLS数据中的健康植物性饮食指数 (hPDI) 和不健康植物性饮食指数 (uPDI)
北京大学"中国老年健康调查"(CLHLS)是一项覆盖全国23省市的长期追踪研究,1998-2018年间完成8次入户调查,累计访问11.3万人次,重点关注高龄老人健康。研究发现饮食模式对老年健康有重要影响,植物性饮食(如地中海饮食)对糖尿病、心血管疾病等具有保护作用。研究者开发了专用R包sciclhls,包含CLHLS.hPDI和CLHLS.UPDI函数,可从CLHLS数据库便捷提取健康/不健康植物性饮食指数,为后续老年健康饮食研究提供分析工具。该研究为探索饮食模式与老年健康关系提供了重要原创 2025-06-23 10:03:00 · 673 阅读 · 0 评论 -
charlsCMI函数发布,秒提取charls数据心脏代谢指数(CMI)
心脏代谢指数(CMI)是反映肥胖和血脂的新型指标,研究表明其与糖尿病及多种慢性病显著相关。本文介绍了CMI的计算方法,并利用CHARLS数据开发了专用提取函数charlsCMI,通过ggexplore工具快速挖掘CMI与其他变量的关联性。结果显示CMI与TYG、高血压等代谢指标显著相关(P<0.05),为研究者提供了高效的数据分析途径。该工具简化了CMI相关研究流程,有助于发现潜在的健康关联因素。原创 2025-06-19 09:15:52 · 741 阅读 · 0 评论 -
中国老年健康调查(CLHLS)数据挖掘教程(1)--CLHLS简介和数据下载
北京大学主持的"中国老年健康调查(CLHLS)"是一项覆盖全国23个省市的长期追踪研究,1998-2018年间完成8次调查,累计入户访问11.3万人次,其中80岁以上高龄老人占67.4%。研究收集了老人健康、认知、社会参与及照料需求等丰富数据,并包含2.89万死亡老人临终前状况。调查数据已通过开放平台免费共享,被1万多位学者使用,产出大量学术成果。该数据集以sav格式存储,包含8次调查数据,采用特定编码系统标记不同变量类型和缺失值。作为研究中国高龄老人健康的重要资源,该调查特别适合膳食模原创 2025-06-13 11:38:47 · 5047 阅读 · 2 评论
分享