数据分析通常都是从一个很大的数据表中摘取需要的列来进行数据分析,在dplyr中常使用select函数来筛选满足条件的列
###列名清洗,去除特殊字符空格等替换为 “_”
df %>% janitor::clean_names()
###摘取包含匹配字符的列
df %>% select_if( !grepl("nn|nCount_RNA|nFeature_RNA", names(.),ignore.case = T) )
df %>% select( matches("Parttern_1|Parttern_2|Parttern_3") )
df %>% select(contains("parttern"))
###where 摘取向量类型数值型、字符型向量的列
df %>% select(where(is.numeric))
df %>% select(where(is.character))
本文介绍了如何在dplyr中使用select函数进行列名清洗、筛选特定字符列、按模式匹配和条件选择向量类型的数据。通过janitor的clean_names()和正则表达式,掌握高效的数据预处理和特征选择方法。
1038

被折叠的 条评论
为什么被折叠?



