有一个基因表达相关数据集,包含基因名称、基因在实验组中的表达量(以标准化后的数值表示)、基因在对照组中的表达量(同样是标准化后的数值)以及对应的 P 值(用于衡量差异的统计学显著性,这里为模拟值)
基因名称 | 实验组表达量 | 对照组表达量 | P 值 |
---|---|---|---|
Gene1 | 1.2 | 0.8 | 0.01 |
Gene2 | 0.9 | 1.1 | 0.05 |
Gene3 | 1.5 | 0.7 | 0.001 |
Gene4 | 0.8 | 1.0 | 0.1 |
Gene5 | 1.3 | 0.9 | 0.02 |
Gene6 | 0.7 | 1.2 | 0.08 |
Gene7 | 1.6 | 0.6 | 0.0005 |
Gene8 | 1.0 | 1.0 | 0.5 |
import pandas as pd
import numpy as np
import matplotlib.pyp