🔬 基于OmicVerse的Bulk RNA-seq数据细胞类型解卷积与模拟单细胞生成
1. 数据准备与依赖库
import omicverse as ov
import scanpy as sc
import pandas as pd
核心库说明:
- OmicVerse:专注于多组学数据整合,其
tl.deconvolution模块支持基于单细胞参考的Bulk数据细胞类型分解 - Scanpy:单细胞数据处理神器,用于数据标准化、质控和整合
- Pandas:用于表格数据读取与处理
2. 数据读取与格式标准化
2.1 Bulk RNA-seq数据加载
bulk_data = pd.read_csv('bulk_rna_seq.csv', index_col=0)
- 数据格式要求:
CSV文件中行名为基因名,列名为样本名,数值为基因表达量(如原始计数或TPM) - 注意事项:
若数据为基因-样本矩阵,需通过.T转置为AnnData要求的样本-基因格式
2.2 单细胞参考数据加载
single_cell_ref = sc.read_10x_mtx(
'single_cell_data/filtered_gene_bc_matrices/hg19/',
var_names='gene_symbols', cache=True
)
single_cell_ref.var_names_make_unique() # 确保基因名唯一
- 数据来源:
10x Genomics标准输出的过滤后矩阵(filtered_gene_bc_matrices) - 格式说明:
包含3个文件:matrix.mtx(表达矩阵)、barcodes.tsv(细胞 barcode)、features.tsv(基因信息)

最低0.47元/天 解锁文章
3万+

被折叠的 条评论
为什么被折叠?



