一、翻译效率计算
(1)准备文件:
转录组和翻译组测序的表达量表(经过标准化的TPM/FPKM)矩阵如图

(2)实现代码
## get TPM值
import pandas as pd
import numpy as np
import sys
tpm = sys.argv[1] ##输入TPM表达量表 如TPM.gene.xls
outfile = sys.argv[2] ##输出文件名字,如TE.xls
df = pd.read_csv(tpm, index_col=0, sep="\t")
rna_cols = [col for col in df.columns if 'RNA' in col]
ribo_cols = [col for col in df.columns if 'Ribo' in col]
##配对列名去除前缀
def get_suffix(col):
return "_".join(col.split("_")[1:])
pairs_name = []
for rna_col in rna_cols:
suffix = get_suffix(rna_col)
ribo_col = "Ribo_" + suffix
if ribo_col in ribo_cols:
pairs_name.append((rna_col, ribo_col))
##创建TE的数据框
te_df = pd.DataFrame(index=df.index)
for rna, ribo in pairs_name:
te_name = get_suffix(ribo)
te_df[te_name] = df[ribo]/df[rna].replace(0, np.nan)
##保存

最低0.47元/天 解锁文章
32

被折叠的 条评论
为什么被折叠?



