
R
文章平均质量分 73
请你喝好果汁641
这个作者很懒,什么都没留下…
展开
-
R for Data Science(3)
重点:介绍了dplyr包中用于操作数据框的工具,包括行操作、列操作和组操作。下一步:深入学习特定类型数据的转换方法(如数字、字符串、日期等)。原创 2025-05-18 14:30:19 · 1063 阅读 · 0 评论 -
R语言实战第5章(1)
R提供了丰富的统计函数,用于计算各种描述性统计量。这些函数不仅可以直接应用于数值向量,还可以通过参数调整来满足不同的需求。函数描述用例mean(x)平均数返回值为2.5median(x)中位数返回值为2.5sd(x)标准差返回值为1.29var(x)方差返回值为1.67mad(x)绝对中位差(median absolute deviation)返回值为1.48求分位数返回x的30%和84%分位点range(x)求值域返回值为c(1,4)求值域的差返回值为3sum(x)求和返回值为10滞后差分。原创 2025-05-12 23:18:28 · 946 阅读 · 0 评论 -
学习笔记:使用 `CMplot` 绘制 SNP 密度图
【代码】学习笔记:使用 `CMplot` 绘制 SNP 密度图。原创 2025-03-04 12:46:30 · 553 阅读 · 0 评论 -
R语言|误差棒、显著符号柱状图
看这个https://mp.weixin.qq.com/s/3O618tFVccxD2KJ9Es7EGQ。以及~/yiyaoran/jupyter/mean-p-R/PH_EH/表型数据分析.ipynb。原创 2025-02-20 16:44:14 · 138 阅读 · 0 评论 -
R 语言植沟文件读取及保存方式
希望这份总结对你有帮助!如果有其他问题,欢迎随时提问。原创 2025-02-05 23:25:32 · 452 阅读 · 0 评论 -
R语言学习笔记-2数据读取、导出
在R语言中,将数据导出到不同格式的文件是数据分析过程中的一个重要步骤。在R语言中,读取不同格式的数据文件是数据分析的第一步。原创 2024-12-13 14:46:34 · 1218 阅读 · 0 评论 -
R语言学习笔记-1
R语言的数据类型包括向量、矩阵、数组、数据框、因子和列表。数据框(Data Frame)是R中最常用的数据结构。基础操作包括算术运算、逻辑判断、数据类型操作等。统计与可视化:R提供了丰富的统计分析功能,如均值、标准差、相关性分析和绘图功能。原创 2024-12-13 14:04:35 · 1095 阅读 · 0 评论 -
gtf文件中基因注释数据处理与提取
以下是处理基因注释数据、筛选匹配基因以及输出结果的关键步骤。我们使用的数据包括Excel文件 (excel_data) 和GTF文件 (gtf_df),目标是提取匹配的基因并生成新的文件。原创 2024-12-12 21:02:47 · 1053 阅读 · 0 评论 -
GTF转为excel文件
加载所需包:使用读取 GTF 文件,使用writexl或openxlsx导出数据。读取数据:通过import()函数导入 GTF 文件,转换为数据框。数据筛选:可以根据seqnames等字段对数据进行过滤,选择感兴趣的染色体或区域。因子操作:处理因子型数据时,需根据需要重新设置因子水平。导出数据:针对大数据集,将其分割后导出到多个 Excel 文件中。希望这份笔记对你理解和处理 GTF 文件数据有所帮助!如果有任何问题或需要进一步的解释,请随时提问。原创 2024-12-12 19:45:27 · 777 阅读 · 0 评论 -
长、宽数据表格转换
默认情况下melt会认为全部为数值的每一列都是带有变量的值,包括月份和日期,都合并在了一起,标题行置于variable列,数值置于value列。但是有的时候我们想知道每月里面每一天空气指标臭氧、太阳、风和温度的值,这个时候我们可以设置id.vars=c(“”)来去除指定的列,只将其他数据做变形。v2 = melt(v1, measure.vars = c()) 可以用measure.vars指定只用某些进行改变。可以选择指定工作表名或工作表索引。原创 2024-12-03 21:26:37 · 341 阅读 · 0 评论 -
单细胞|检查基因列表是否存在于数据集并提取缺失基因
从数据结构的角度来看,这段代码的核心是操作一个列表对象 ,并使用逻辑检查操作()对其内容(基因名称)进行处理,以找到哪些基因缺失于目标数据集 中。以下是逐步的解读: 是一个 列表,它包含两个基因集,每个基因集是一个 字符向量,代表基因的名称。 是一个列表,包含两个元素: 是一个字符向量,长度为 6。 是另一个字符向量,长度为 6。2. 数据结构: 是一个 字符向量,通常来自 Seurat 对象的行名,表示数据集中所有基因的名称。 是一个长度为 4 的字符向量,代表数据集中实际原创 2024-11-21 16:08:10 · 724 阅读 · 0 评论 -
单细胞分析核心操作概述:亚群整合、提取与重命名,以及元数据与 Assay 的交互更新
提取某些细胞群并细分为亚群(如成纤维细胞分为 FIB1、FIB2、FIB3)后,需要将这些细分注释的结果合并回大群,形成完整注释。结果: 的 metadata 中新增一列 ,整合了原始分群和亚群注释。在可视化中显示如:用途:用于保存细化的细胞注释,方便在后续分析中直接使用。从大群中提取某些特定的亚群,或删除少量不需要的亚群。通过 提取:提取分群编号为 0 和 2 的细胞。通过 提取:提取细胞类型为 “Naive CD4 T” 和 “Memory CD4 T” 的细胞。原创 2024-11-19 11:35:55 · 2855 阅读 · 0 评论 -
monocle3-轨迹推断
是一个用于分析单细胞转录组数据的 R 包,主要用于进行和。它提供了一整套处理和可视化单细胞RNA-seq数据的工具,尤其擅长于分析细胞在动态生物学过程中(如发育、分化、疾病进展等)的变化。原创 2024-11-18 15:19:38 · 1346 阅读 · 0 评论 -
M2-8. 基因标记物识别
找出每个细胞群体的标记基因,过滤条件包括对数折叠变化和最小表达比例。:从每个群体中筛选出最显著的 2 个基因,这些基因具有最大的对数折叠变化,是群体的代表性标记基因。这种分析方法通常用于细胞类型标注或群体特征识别,帮助我们理解不同细胞群体之间的差异和特征基因。原创 2024-11-18 15:12:21 · 548 阅读 · 0 评论 -
dplyr::slice_max()以及为什么分组
是一个非常实用的函数,特别是在需要从每个分组中提取 top n 或 top比例记录的情况下。它通过排序选出每个分组中符合条件的最大值记录,常用于选择 top 记录(如基因表达数据、销售数据等)。先分组是为了确保是在每个cluster内部进行操作。这样可以确保在每个分组(如细胞群体)内找到最大值,而不是在整个数据集上寻找。如果没有group_by(),你将无法按群体分别选择最大值,而是会选出所有数据中的前两个最大值,从而丧失了按组进行分析的目的。原创 2024-11-18 14:58:02 · 728 阅读 · 0 评论 -
M2-4. 整合数据¶
选择高变基因:选择用于整合的基因(通常是变异性较大的基因)。找到锚点:通过选择的基因在不同数据集之间找到共享的细胞特征。数据整合:基于找到的锚点整合不同数据集的表达数据。设置整合数据为默认数据:将整合后的数据作为默认的数据源,以便进行后续分析。这种数据整合方法是Seurat中非常常用的一种方式,旨在减少不同数据集之间的批次效应,使得跨样本或跨实验的分析更加可靠。这段代码的主要目的是整合多个数据集,并进行基因选择和数据整合。以下是每个步骤涉及到的 Seurat这段代码展示了如何在 Seurat。原创 2024-11-18 14:48:21 · 592 阅读 · 0 评论 -
apply、sapply、lapply函数
apply():适用于矩阵或数据框,按行或按列操作,返回向量或矩阵。lapply():适用于列表或数据框,返回一个列表,即使函数结果是向量。sapply():适用于向量或列表,返回一个简化的对象(向量或矩阵),如果可能的话。数据框data.frame)和列表list)使用lapply(),因为它们的每一列或元素可以是不同的数据类型。向量使用sapply(),因为我们通常希望返回一个简化的结果。矩阵(或二维数据)使用apply(),因为它提供了对行或列的操作能力。原创 2024-11-18 14:19:56 · 542 阅读 · 0 评论 -
match` 函数以及match与which区别
nomatch。原创 2024-11-18 11:06:15 · 634 阅读 · 0 评论 -
`which()`函数
which()非常有用,它可以帮助你根据某些条件筛选数据或获得特定条件下的元素索引。在处理数据框、向量或矩阵时,经常用来找出满足某个条件的元素位置,方便进一步的处理。原创 2024-11-18 10:54:09 · 442 阅读 · 0 评论 -
`which()`函数
which()非常有用,它可以帮助你根据某些条件筛选数据或获得特定条件下的元素索引。在处理数据框、向量或矩阵时,经常用来找出满足某个条件的元素位置,方便进一步的处理。原创 2024-11-18 10:43:33 · 490 阅读 · 0 评论 -
R中线性回归及其权重和截距的计算
通过上述代码,您可以可视化身高与体重之间的关系,并使用线性回归模型来分析和预测体重。使用summary()函数可以深入了解模型的性能和显著性。原创 2024-10-07 21:15:26 · 910 阅读 · 0 评论 -
R中sink函数,输出重定向到一个文件
在 R 语言中,sink()函数用于将输出重定向到一个文件,而不是默认的控制台。使用sink()可以有效地保存脚本的输出结果,尤其是在进行数据分析时。以下是sink()原创 2024-10-07 20:11:54 · 706 阅读 · 0 评论 -
R中的箱线图
ggboxplot 是 ggpubr 包中的一个函数,主要用于绘制箱线图(boxplot),它能够直观地展示不同组之间的数据分布和比较。原创 2024-10-07 19:48:50 · 1412 阅读 · 0 评论 -
grepl函数
grepl是 R 语言中的一个函数,专门用于在字符串中进行模式匹配,返回一个逻辑向量,指示每个元素是否匹配给定的正则表达式。原创 2024-09-09 09:13:15 · 511 阅读 · 0 评论