基于OmicVerse的Bulk RNA-seq数据细胞类型解卷积与模拟单细胞生成

🔬 基于OmicVerse的Bulk RNA-seq数据细胞类型解卷积与模拟单细胞生成

1. 数据准备与依赖库

import omicverse as ov
import scanpy as sc
import pandas as pd

核心库说明

  • OmicVerse:专注于多组学数据整合,其tl.deconvolution模块支持基于单细胞参考的Bulk数据细胞类型分解
  • Scanpy:单细胞数据处理神器,用于数据标准化、质控和整合
  • Pandas:用于表格数据读取与处理

2. 数据读取与格式标准化

2.1 Bulk RNA-seq数据加载

bulk_data = pd.read_csv('bulk_rna_seq.csv', index_col=0)
  • 数据格式要求
    CSV文件中行名为基因名,列名为样本名,数值为基因表达量(如原始计数或TPM)
  • 注意事项
    若数据为基因-样本矩阵,需通过.T转置为AnnData要求的样本-基因格式

2.2 单细胞参考数据加载

single_cell_ref = sc.read_10x_mtx(
    'single_cell_data/filtered_gene_bc_matrices/hg19/',
    var_names='gene_symbols', cache=True
)
single_cell_ref.var_names_make_unique()  # 确保基因名唯一
  • 数据来源
    10x Genomics标准输出的过滤后矩阵(filtered_gene_bc_matrices
  • 格式说明
    包含3个文件:matrix.mtx(表达矩阵)、barcodes.tsv(细胞 barcode)、features.tsv(基因信息)

3. 数据预处理

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值