- 博客(1913)
- 收藏
- 关注

原创 8篇2章1节:认识全球疾病负担数据库 GBD
全球疾病负担数据库(GBD)是一项全面的区域性和全球性疾病负担研究项目,用于评估主要疾病、伤害和风险因素导致的死亡率和残疾情况。全球疾病负担研究是来自 160 多个国家的 12000 多名研究人员的合作成果。在首席研究员克里斯托弗・J・L・默里的领导下,全球疾病负担研究的总部位于华盛顿大学健康指标与评估研究所(IHME),并由比尔及梅琳达・盖茨基金会资助。
2025-04-11 12:09:23
171

原创 《用R探索医药数据科学》学习路径(持续更新,点击查阅相关文章)
市面上的 R 语言培训班和书籍(包括网络上的文章或视频),由于受限于培训时间或书籍篇幅,往往难以深入探讨 R 语言在数据科学或人工智能中的具体应用场景,内容泛泛而谈,最终无法真正解决实际工作中的问题。同时,它们也缺乏针对医药领域的深度结合与讨论。为了解决这些痛点,我们推出了《用 R 探索医药数据科学》专栏。该专栏将持续更新,不仅为您提供系统化的学习内容,更致力于成为您掌握最新、最全医药数据科学技术的得力助手。
2024-11-18 06:22:40
5325
26
原创 处理跨时区数据和夏令时(DST)问题是全球化数据分析中的挑战
市面上的 R 语言培训班和书籍(包括网络上的文章或视频),由于受限于培训时间或书籍篇幅,往往难以深入探讨 R 语言在数据科学或人工智能中的具体应用场景,内容泛泛而谈,最终无法真正解决实际工作中的问题。该专栏将持续更新,不仅为您提供系统化的学习内容,更致力于成为您掌握最新、最全医药数据科学技术的得力助手。夏令时(DST, Daylight Saving Time)是一种为了更有效地利用自然光资源,在夏季将时钟时间调快一小时的制度。通常在春季开始实施,将时钟拨快一小时,在秋季结束时再拨回正常时间。
2025-04-11 12:17:16
662
原创 日期时间数据的格式化与解析
在数据处理的不同阶段,日期时间数据往往需要在不同的格式之间进行转换。R中的 format() 函数提供了灵活的日期时间格式化功能,能够将日期时间对象转换为指定格式的字符串,或将字符串解析为日期时间对象。
2025-04-11 12:15:39
695
原创 日期时间对象的操作
R中日期时间对象的操作不仅限于创建和转换,还包括提取、修改、与操作时间组件等。在这部分,我们将探讨如何使用R操作日期时间对象的各个组成部分。
2025-04-10 09:25:35
598
原创 日期时间数据的转换与处理,日期时间数据的运算
市面上的 R 语言培训班和书籍(包括网络上的文章或视频),由于受限于培训时间或书籍篇幅,往往难以深入探讨 R 语言在数据科学或人工智能中的具体应用场景,内容泛泛而谈,最终无法真正解决实际工作中的问题。同时,它们也缺乏针对医药领域的深度结合与讨论。该专栏将持续更新,不仅为您提供系统化的学习内容,更致力于成为您掌握最新、最全医药数据科学技术的得力助手。R中的日期时间运算非常直观且功能强大,包括加减日期时间、计算时间差等。则返回一个包含时间各部分(年、月、日、时、分、秒)的列表,适用于需要访问各时间组件的情况。
2025-04-10 09:24:14
632
原创 日期时间数据的转换与处理,使用 as.POSIXct() 和 as.POSIXlt() 进行日期时间转换
市面上的 R 语言培训班和书籍(包括网络上的文章或视频),由于受限于培训时间或书籍篇幅,往往难以深入探讨 R 语言在数据科学或人工智能中的具体应用场景,内容泛泛而谈,最终无法真正解决实际工作中的问题。该专栏将持续更新,不仅为您提供系统化的学习内容,更致力于成为您掌握最新、最全医药数据科学技术的得力助手。在R中,日期时间数据通常是以字符串形式存储的,因此第一步通常是将字符串转换为适当的日期时间对象。则返回一个包含时间各部分(年、月、日、时、分、秒)的列表,适用于需要访问各时间组件的情况。
2025-04-10 09:22:54
394
原创 R的日期时间数据的转换与处理
市面上的 R 语言培训班和书籍(包括网络上的文章或视频),由于受限于培训时间或书籍篇幅,往往难以深入探讨 R 语言在数据科学或人工智能中的具体应用场景,内容泛泛而谈,最终无法真正解决实际工作中的问题。POSIXct 是日期时间的数值形式,表示从1970年1月1日00:00:00 UTC到指定日期时间的秒数。POSIXlt 则是列表形式,包含日期时间的各个组成部分,如年、月、日、时、分、秒等。在R中,日期时间数据通常是以字符串形式存储的,因此第一步通常是将字符串转换为适当的日期时间对象。
2025-04-10 09:21:34
444
原创 R的日期时间数据的概念和如何获取当前日期和时间···
另外,在R中,日期通常使用 Date 类型表示,而日期时间则使用 POSIXct 或 POSIXlt 类型表示。POSIXct 是日期时间的数值形式,表示从1970年1月1日00:00:00 UTC到指定日期时间的秒数。POSIXlt 则是列表形式,包含日期时间的各个组成部分,如年、月、日、时、分、秒等。
2025-04-10 09:19:53
529
原创 stringr包不同函数的重点介绍和举例
stringr函数功能str_c()拼接多个字符串为单个字符串str_conv()更改字符串的编码类型计算字符串中指定模式的字符个数判断字符串是否包含指定模式str_dup()将向量中的各字符串重复自身 n 次提取字符串中包含的指定模式(匹配一次)提取字符串中包含的指定模式(匹配所有)计算字符串的长度(即所包含的字符个数)给出指定模式在字符串中的起始位置(输出矩阵)给出指定模式在字符串中的起始位置(输出列表)判断字符串中是否包含指定模式(输出矩阵)判断字符串中是否包含指定模式(输出列表)
2025-04-09 11:57:35
590
原创 提取匹配模式的第一个值和提取所有匹配模式的值
在数据处理和文本分析中,字符串匹配是一项非常重要的操作。stringr包提供了一系列强大的函数来执行字符串匹配和处理任务。本文将详细介绍stringr包中与字符串匹配相关的函数,包括如何使用这些函数进行实际的匹配操作、统计、提取以及替换。
2025-04-09 11:56:10
269
原创 模拟的医疗记录数据集,演示字符串检测和位置查找
在数据处理和文本分析中,字符串匹配是一项非常重要的操作。stringr包提供了一系列强大的函数来执行字符串匹配和处理任务。本文将详细介绍stringr包中与字符串匹配相关的函数,包括如何使用这些函数进行实际的匹配操作、统计、提取以及替换。
2025-04-09 11:55:13
848
原创 字符串检测和位置查找,获取匹配模式成功的字符索引
在数据处理和文本分析中,字符串匹配是一项非常重要的操作。stringr包提供了一系列强大的函数来执行字符串匹配和处理任务。本文将详细介绍stringr包中与字符串匹配相关的函数,包括如何使用这些函数进行实际的匹配操作、统计、提取以及替换。
2025-04-09 11:54:17
457
原创 字符串检测和位置查找,检测字符串是否包含特定模式
在数据处理和文本分析中,字符串匹配是一项非常重要的操作。stringr包提供了一系列强大的函数来执行字符串匹配和处理任务。本文将详细介绍stringr包中与字符串匹配相关的函数,包括如何使用这些函数进行实际的匹配操作、统计、提取以及替换。
2025-04-09 11:53:01
909
原创 字符串的插值 str_glue() 和 学生成绩应用举例
在数据处理和分析中,字符串操作是一项基础且重要的技能。R语言提供了丰富的字符串处理函数,这些函数广泛应用于文本数据的清理、转换、匹配和分析。本文将详细介绍R语言中常用的字符串操作函数,涵盖字符串的修改、提取替换、分割连接和填充插值。
2025-04-09 11:51:56
778
原创 7篇3章6节:特征工程变量子集选择的包装器方法应用
包装器方法通过搜索候选特征子集的空间,并利用模型在子集上的表现来衡量“有用性”。由于这种方法需要对每个候选子集建立并验证模型,因此计算量大,但与此同时,其优势在于模型性能评估能够充分利用训练数据的信息,从而更好地反映出特征对结果的影响。
2025-04-08 16:33:48
743
原创 提取和替换,字符串的截断:str_trunc()
在数据处理和分析中,字符串操作是一项基础且重要的技能。R语言提供了丰富的字符串处理函数,这些函数广泛应用于文本数据的清理、转换、匹配和分析。本文将详细介绍R语言中常用的字符串操作函数,涵盖字符串的修改、提取替换、分割连接和填充插值。
2025-04-08 13:09:04
716
原创 填充和插值,字符串的填充:str_pad()
在数据处理和分析中,字符串操作是一项基础且重要的技能。R语言提供了丰富的字符串处理函数,这些函数广泛应用于文本数据的清理、转换、匹配和分析。本文将详细介绍R语言中常用的字符串操作函数,涵盖字符串的修改、提取替换、分割连接和填充插值。
2025-04-08 13:07:56
763
原创 分割和连接,字符串的连接:str_c()
在数据分析和处理过程中,字符串的操作常常扮演着极其重要的角色。R语言内置了多种功能强大的字符串处理函数,gsub() 就是其中之一。它主要用于字符串的替换、删减、增补和切割,不仅能处理单个字符串,还能处理由字符串组成的向量。
2025-04-08 13:06:31
231
原创 字符串的分割和连接,字符串的分割:str_split()
在数据分析和处理过程中,字符串的操作常常扮演着极其重要的角色。R语言内置了多种功能强大的字符串处理函数,gsub() 就是其中之一。它主要用于字符串的替换、删减、增补和切割,不仅能处理单个字符串,还能处理由字符串组成的向量。
2025-04-08 13:05:18
895
原创 stringr 扩展包中的替换操作
在数据分析和处理过程中,字符串的操作常常扮演着极其重要的角色。R语言内置了多种功能强大的字符串处理函数,gsub() 就是其中之一。它主要用于字符串的替换、删减、增补和切割,不仅能处理单个字符串,还能处理由字符串组成的向量。
2025-04-08 12:23:34
555
原创 7篇3章5节:特征工程变量子集选择的过滤器方法应用
本文将重点阐述如何利用方差系数(Coefficient of Variance, CoV)对连续变量进行标准化,再根据降序排序得到最具代表性的特征,并进一步利用这些筛选出的特征构建二项逻辑回归模型,以评估这种方法在分类问题上的表现。同时,我们还将结合相关矩阵,探讨变量之间的相关性对模型显著性检验和整体预测效果的影响。
2025-04-08 11:28:30
364
原创 字符串的操作之gsub()函数的基础用法
在数据处理和分析中,字符串操作是一项基础且重要的技能。R语言提供了丰富的字符串处理函数,这些函数广泛应用于文本数据的清理、转换、匹配和分析。本文将详细介绍R语言中常用的字符串操作函数,涵盖字符串的修改、提取替换、分割连接和填充插值。
2025-04-07 11:13:08
627
原创 stringr扩展包的复杂数据排序演示
Hadley Wickham 是一位著名的统计学家和软件开发者,以其对 R 编程社区的贡献而闻名,特别是通过开发 stringr 包。这个包是 Tidyverse 生态系统的一部分,专注于简化 R 中的字符串操作。
2025-04-07 11:11:54
773
原创 获取字符串的排序顺序
在R语言的生态系统中,字符串处理一直是一个重要且复杂的任务。早期,R语言的基础包提供了一些基本的字符串处理功能,但当处理变得更加复杂时,这些功能常常显得力不从心。为了填补这一空白,Hadley Wickham及其团队开发了stringr包,旨在简化R语言中字符串处理的操作,特别是为那些不熟悉正则表达式的用户提供更友好的接口。
2025-04-07 11:10:38
322
原创 字符串的排序
在处理字符串数据时,排序操作非常常见。stringr包提供了str_sort()和str_order()两个函数,用于对字符串进行排序。
2025-04-07 11:09:42
919
原创 字符串转换为标题风格和句子风格
R语言是数据科学和统计分析的强大工具,尤其在处理字符串数据时,stringr扩展包提供了丰富且便捷的函数集合。本篇文章将深入探讨如何使用stringr扩展包中的函数进行字符串的基本操作,包括查阅、大小写转换和排序问题等。这些技能在数据预处理、文本分析和报表生成过程中尤为重要。
2025-04-07 10:51:49
411
原创 7篇3章4节:特征工程的变量子集选择
变量子集选择的目的是在众多特征中筛选出最具有预测能力、最具代表性的那一部分,从而提高模型的性能、减少训练时间、降低过拟合风险,并提升可解释性。
2025-04-07 10:47:36
154
原创 字符串转换为标题风格和句子风格
当需要将字符串的第一个字母大写,并保持其他字母小写时,str_to_sentence()函数能够实现这种句子风格的转换。
2025-04-06 09:30:05
405
原创 stringr扩展包之字符串大小写的转换
字符串的大小写转换在文本标准化、数据清理以及显示格式调整时非常有用。stringr包提供了一系列函数,用于实现大小写的转换,包括将字符串转换为全大写、全小写、标题风格和句子风格。
2025-04-06 09:29:03
974
原创 stringr扩展包之包含病人姓名和诊断信息的复杂应用示例
R语言是数据科学和统计分析的强大工具,尤其在处理字符串数据时,stringr扩展包提供了丰富且便捷的函数集合。本篇文章将深入探讨如何使用stringr扩展包中的函数进行字符串的基本操作,包括查阅、大小写转换和排序问题等。这些技能在数据预处理、文本分析和报表生成过程中尤为重要。
2025-04-06 09:27:54
1022
原创 stringr扩展包之获取字符串中的单词
R语言是数据科学和统计分析的强大工具,尤其在处理字符串数据时,stringr扩展包提供了丰富且便捷的函数集合。本篇文章将深入探讨如何使用stringr扩展包中的函数进行字符串的基本操作,包括查阅、大小写转换和排序问题等。这些技能在数据预处理、文本分析和报表生成过程中尤为重要。
2025-04-06 09:26:45
575
原创 R的stringr扩展包之提取字符串的子串
在R语言的生态系统中,字符串处理一直是一个重要且复杂的任务。早期,R语言的基础包提供了一些基本的字符串处理功能,但当处理变得更加复杂时,这些功能常常显得力不从心。为了填补这一空白,Hadley Wickham及其团队开发了stringr包,旨在简化R语言中字符串处理的操作,特别是为那些不熟悉正则表达式的用户提供更友好的接口。
2025-04-06 09:25:33
727
原创 字符串长度的统计
Hadley Wickham 是一位著名的统计学家和软件开发者,以其对 R 编程社区的贡献而闻名,特别是通过开发 stringr 包。这个包是 Tidyverse 生态系统的一部分,专注于简化 R 中的字符串操作。
2025-04-05 10:21:27
880
原创 正则表达式的基础要点的应用示例
上面这段代码的作用是将字符串中的电话号码从123-456-7890的格式转换为(123) 456-7890的格式。具体来说,gsub函数使用正则表达式查找电话号码的模式(即三个数字、一个连字符、三个数字、一个连字符和四个数字),然后将其替换为新的格式,其中三个数字被括号括起来,连字符前添加一个空格。最终的输出是格式化后的电话号码。
2025-04-05 10:20:06
810
原创 正则表达式的基础语法的常用字符类之\s 和 \S
R语言提供了一些内置函数来处理正则表达式,如grep()、sub()、gsub()、strsplit()和paste()。这些函数结合正则表达式的使用,使得字符串处理变得更加方便和高效。在本节中,我们将详细探讨这些函数的用法,并通过示例演示如何在R中进行字符串处理。
2025-04-05 10:18:57
549
原创 正则表达式的基础语法的常用字符类之\w 和 \W
正则表达式(Regular Expression,简称regex)广泛用于字符串操作中,它可以通过定义一个“规则字符串”来对文本进行模式匹配,从而实现字符串的查找、替换、分割等操作。正则表达式的语法虽然复杂,但它的强大之处在于能够灵活地处理非结构化文本,帮助数据分析者快速、高效地提取有用信息,解决实践中遇到的各种与文本相关的数据问题。
2025-04-05 10:17:54
825
原创 正则表达式的基础语法的常用字符类之\d 和 \D
正则表达式(Regular Expression,简称regex)广泛用于字符串操作中,它可以通过定义一个“规则字符串”来对文本进行模式匹配,从而实现字符串的查找、替换、分割等操作。正则表达式的语法虽然复杂,但它的强大之处在于能够灵活地处理非结构化文本,帮助数据分析者快速、高效地提取有用信息,解决实践中遇到的各种与文本相关的数据问题。
2025-04-05 10:16:40
899
原创 正则表达式的基础语法的特殊字符
R语言提供了一些内置函数来处理正则表达式,如grep()、sub()、gsub()、strsplit()和paste()。这些函数结合正则表达式的使用,使得字符串处理变得更加方便和高效。在本节中,我们将详细探讨这些函数的用法,并通过示例演示如何在R中进行字符串处理。
2025-04-04 09:33:54
737
原创 正则表达式的基础语法的基本符号之 ?、[]、|和()符号
在数据科学和文本分析中,字符串处理是一项至关重要的技能。无论是在数据清理、数据转换,还是在文本挖掘中,字符串操作都必不可少。而正则表达式作为一种强大的文本模式匹配工具,在处理复杂字符串时尤为有效。本文将深入探讨如何在R语言中高效地进行字符串处理和正则表达式的操作。
2025-04-04 09:32:31
858
trekcolors R 包为科幻迷和数据分析爱好者提供了独特的 Star Trek 和 LCARS 调色板
2024-11-17
R语言数据去重与匹配:20种常用函数详解及实战示例
2024-11-16
10个例子,学会使用管道操作符 %>% 进行数据处理与可视化
2024-11-11
在R语言中实现带有边缘直方图、箱线图和密度图的散点图,以及连续变量直方图的多图展示
2024-11-09
R语言数据重塑,20种高效函数操作数据格式与管理
2024-11-02
R语言字符串操作全攻略,30个技巧一览无余!
2024-10-28
一次性掌握7种强大的临床预测模型
2024-10-27
掌握20个R语言数据清洗技巧,让数据处理更加高效和简单!
2024-10-26
基于机器学习的高血压预测模型构建与评估
2024-10-25
如何通过R代码设置RStudio全局环境
2024-10-23
R语言版本检查与扩展包自动更新示例
2024-10-21
用R语言贪心算法解决旅行商问题的模拟演示
2024-10-17
用R演示药物对糖尿病患者血糖影响的方差分析及可视化
2024-10-17
基于卵巢癌数据的治疗和年龄组生存曲线分析
2024-10-14
使用R语言和ggplot2基于iris数据集绘制常见科研图表
2024-10-12
用Python的基于逻辑回归的高血压预测模型.py
2024-10-05
用R语言创建基于逻辑回归的高血压预测模型(准确率达到82%)
2024-10-05
基于主成分分析的临床高血压患者数据分析与可视化
2024-10-05
基于R语言的主成分分析:模拟数据生成与可视化
2024-10-05
从药品销售与疗效数据分析例子学会R语言中的ggplot2绘图技巧
2024-09-16
用R进行复杂用户行为数据分析:深入理解用户行为、转化率与交互模式
2024-09-15
使用R语言igraph和ggraph包绘制基因相互作用网络图
2024-09-07
使用Shiny构建带有蓝色背景的双人五子棋游戏
2024-09-06
R语言与Shiny的双人飞行棋小游戏代码:回合制胜负与实时状态显示
2024-09-06
使用R语言和recommenderlab包实现基于物品的协同过滤推荐系统及内容属性综合评分
2024-09-05
使用R语言和recommenderlab包构建基于用户协同过滤的自媒体内容推荐系统,结合多属性分析
2024-09-05
使用R语言和glmnet包构建血糖预测模型
2024-09-04
使用R语言和xgboost包构建血糖预测模型
2024-09-04
使用R语言和randomForest包构建血糖预测模型
2024-09-04
使用R语言实现CLARA算法对鸢尾花数据集进行大规模聚类分析
2024-09-03
使用R语言的SOM算法对鸢尾花数据集进行自组织映射分析
2024-09-03
使用R语言中的Fuzzy C-Means算法对iris数据集进行模糊聚类分析
2024-09-03
在R中用谱聚类算法,基于图论的高效数据分组与分析
2024-09-03
在R中使用PCA降维与K-means聚类结合的算法,高效的数据分类与可视化
2024-09-03
在R中使用高斯混合模型,多分布下的概率聚类与模型评估
2024-09-03
在R中使用DBSCAN,一种密度驱动的高级聚类算法,识别噪声与复杂形状
2024-09-03
在R中使用层次聚类算法,探索数据层次关系的高级聚类方法
2024-09-03
理解K-means聚类算法:基于R语言对iris数据集的详细实现与分析,R代码
2024-09-01
模拟家庭收入、区域、年龄、血压及多属性的大规模数据集生成的R代码和一份10000人数据集,可以用于学习机器学习
2024-09-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人