Ribo测序翻译效率计算及可视化

最新推荐文章于 2025-11-27 18:56:38 发布

原创

最新推荐文章于 2025-11-27 18:56:38 发布 · 308 阅读

0 ·

CC 4.0 BY-SA版权

文章标签：

#python #开发语言 #笔记

一、翻译效率计算

（1）准备文件：

转录组和翻译组测序的表达量表（经过标准化的TPM/FPKM）矩阵如图

（2）实现代码

## get TPM值
import pandas as pd
import numpy as np
import sys 
tpm = sys.argv[1]  ##输入TPM表达量表  如TPM.gene.xls
outfile = sys.argv[2]  ##输出文件名字，如TE.xls

df = pd.read_csv(tpm, index_col=0, sep="\t")
rna_cols = [col for col in df.columns if  'RNA' in col]
ribo_cols = [col for col in df.columns if 'Ribo' in col]

##配对列名去除前缀
def get_suffix(col):
    return "_".join(col.split("_")[1:])

pairs_name = []

for rna_col in rna_cols:
    suffix = get_suffix(rna_col)
    ribo_col = "Ribo_" + suffix
    if ribo_col in ribo_cols:
        pairs_name.append((rna_col, ribo_col))

##创建TE的数据框
te_df = pd.DataFrame(index=df.index)
for rna, ribo in pairs_name:
    te_name = get_suffix(ribo)
    te_df[te_name] = df[ribo]/df[rna].replace(0, np.nan)

##保存