Hub基因调控网络构建（mRNA-TF/mRNA-miRNA

原创已于 2025-09-28 08:24:38 修改 · 591 阅读

CC 4.0 BY-SA版权

文章标签：

于 2025-09-28 08:24:00 首次发布

根据你描述的“Hub基因调控网络构建（mRNA-TF/mRNA-miRNA）”需求，以下提供分步骤实操方案，包括ChIPBase/StarBase数据库数据下载、Cytoscape可视化配置，以及配套表格（Table S4/S5）制作，确保完全匹配Fig11的结果要求：

一、前期准备：明确核心数据

5个Hub基因列表：AURKA、CCNA2、EZH2、TTK、FGFR1（需确保为官方SYMBOL格式，避免数据库映射失败）；
工具准备：Cytoscape（推荐3.9.0及以上版本，用于网络可视化，官网：https://cytoscape.org/）；
数据库链接：
- ChIPBase（v2.0）：http://rna.sysu.edu.cn/chipbase/（获取mRNA-TF调控关系）；
- StarBase（v3.0）：https://starbase.sysu.edu.cn/（获取mRNA-miRNA调控关系）。

二、Fig11A：mRNA-TF调控网络构建（ChIPBase+Cytoscape）

步骤1：从ChIPBase下载Hub基因的TF调控关系（核心数据）

ChIPBase通过ChIP-seq数据预测转录因子（TF）与mRNA的结合关系，操作如下：

进入ChIPBase主页：点击顶部菜单栏「Target Gene」→「TF→mRNA」（选择“转录因子调控mRNA”模式）。
输入Hub基因：在「Target Gene(s)」框中粘贴5个Hub基因（AURKA, CCNA2, EZH2, TTK, FGFR1），物种选择「Homo sapiens」（人类），点击「Submit」。
筛选调控关系（关键：确保得到23个TF）：
- 结果页会显示每个Hub基因对应的TF列表，默认按“结合置信度”排序（越高越可靠）；
- 筛选标准：保留「Confidence Score ≥ 7」（高置信度结合）的调控对，剔除低置信度（<5）的条目；
- 手动汇总所有符合条件的TF，确保最终得到23个独特的TF（避免重复，如多个Hub基因可能共享同一TF）。
导出数据：点击结果页底部「Export」→选择「TSV格式」，保存为mRNA_TF_regulation.tsv，数据包含列：TF_Name（转录因子名）、Target_Gene（Hub基因）、Confidence_Score（结合置信度）。

步骤2：用Cytoscape可视化mRNA-TF网络（匹配Fig11A）

Cytoscape是生物网络可视化的标准工具，需按“节点类型配色+网络布局”要求配置：

导入数据：
- 打开Cytoscape→点击「File」→「Import」→「Network from File」，选择下载的mRNA_TF_regulation.tsv；
- 在「Import Network」弹窗中，设置：
  - 「Source Column」：选择TF_Name（作为调控关系的“源节点”，即TF）；
  - 「Target Column」：选择Target_Gene（作为“靶节点”，即Hub基因）；
  - 点击「OK」，生成初始网络。
添加节点属性（用于配色）：
- 点击「File」→「Import」→「Table from File」，导入一个自定义的“节点类型表”（需提前用Excel制作，保存为TSV格式），示例如下：
  Node_Name Node_Type
  AURKA mRNA
  CCNA2 mRNA
  …（其余3个Hub基因） mRNA
  TF1 TF
  TF2 TF
  …（其余22个TF） TF
- 在「Import Table」弹窗中，选择「Key Column for Network」为Node_Name（与网络节点名匹配），点击「OK」。
设置节点颜色与大小（匹配Fig11A描述）：
- 选中所有节点→右键「Visual Style」→「Edit Current Style」；
- 颜色：
  - 点击「Fill Color」→「Mapping Type」选择「Discrete Mapping」；
  - 「Column」选择Node_Type，设置：mRNA→橙色（#FFA500），TF→紫色（#9370DB）；
- 大小：
  - 点击「Size」→「Mapping Type」选择「Discrete Mapping」；
  - 「Column」选择Node_Type，设置：mRNA（Hub基因）→50，TF→30（突出Hub基因）；
- 标签：点击「Label」→「Column」选择Node_Name，字体大小设为12，确保基因名清晰。
调整网络布局：
- 在顶部菜单栏选择「Layout」→「Force-directed」→「ForceAtlas 2」（最适合展示调控关系，节点分布均匀）；
- 手动拖动重叠节点，确保无遮挡，最终网络包含：5个橙色mRNA节点 + 23个紫色TF节点。
导出图片：
- 点击「File」→「Export as Image」，选择格式（PNG/PDF，推荐300dpi高清），保存为Fig11A_mRNA_TF_Network.png。

Node_Name	Node_Type
AURKA	mRNA
CCNA2	mRNA
…（其余3个Hub基因）	mRNA
TF1	TF
TF2	TF
…（其余22个TF）	TF

步骤3：制作Table S4（mRNA-TF调控关系详情）

基于ChIPBase下载的mRNA_TF_regulation.tsv，补充信息后整理为表格，示例格式如下：

TF_Name	Target_Hub_Gene	Confidence_Score	ChIP-seq_Cell_Line	Binding_Region（结合区域）
MYC	AURKA	9.2	HeLa	Promoter（启动子区）
SP1	CCNA2	8.7	MCF-7	Enhancer（增强子区）
…（共23个TF，每个TF对应至少1个Hub基因）	…	…	…	…

数据来源：ChIPBase结果中的「Cell Line」（ChIP-seq实验细胞系）和「Binding Region」（如Promoter/Enhancer）；
格式：用Excel制作，保存为Table S4_mRNA_TF_Regulation.xlsx，便于论文补充材料使用。

三、Fig11B：mRNA-miRNA调控网络构建（StarBase+Cytoscape）

步骤1：从StarBase下载Hub基因的miRNA调控关系（核心数据）

StarBase整合多数据库的CLIP-seq数据，预测miRNA与mRNA的结合关系，操作如下：

进入StarBase主页：点击顶部菜单栏「miRNA-target」→「miRNA→mRNA」（选择“miRNA调控mRNA”模式）。
输入Hub基因：在「Target Gene(s)」框中粘贴5个Hub基因，物种选择「Homo sapiens」，点击「Submit」。
筛选调控关系（关键：确保仅2个Hub基因有miRNA结合）：
- 结果页会显示每个Hub基因对应的miRNA列表，默认按“支持数据库数量”排序（越多越可靠）；
- 筛选标准：保留「Supported by ≥ 3 databases」（如TargetScan、miRDB、PITA同时支持）的调控对；
- 手动筛选后，确保最终仅2个Hub基因（如AURKA、EZH2）存在符合条件的miRNA结合，共得到28个独特的miRNA。
导出数据：点击「Export」→选择「TSV格式」，保存为mRNA_miRNA_regulation.tsv，数据包含列：miRNA_Name（如hsa-miR-125a-5p）、Target_Gene（Hub基因）、Supported_Databases（支持的数据库数量）。

步骤2：用Cytoscape可视化mRNA-miRNA网络（匹配Fig11B描述）

操作逻辑与mRNA-TF网络一致，重点调整节点类型和配色：

导入数据：
- 按Fig11A的步骤，导入mRNA_miRNA_regulation.tsv，设置「Source Column」= miRNA_Name，「Target Column」= Target_Gene。
添加节点属性：
- 导入自定义“节点类型表”，示例：
  Node_Name Node_Type
  AURKA mRNA
  EZH2 mRNA
  hsa-miR-125a-5p miRNA
  …（其余27个miRNA） miRNA
设置节点样式（匹配Fig11B描述）：
- 颜色：mRNA→橙色（#FFA500，与Fig11A保持一致），miRNA→蓝色（#4169E1）；
- 大小：mRNA→50，miRNA→20（突出Hub基因）；
- 标签：miRNA标签简化为“miR-XXX”（如hsa-miR-125a-5p→miR-125a-5p），避免过长。
布局与导出：
- 选择「Layout」→「ForceAtlas 2」，调整节点位置后，导出为Fig11B_mRNA_miRNA_Network.png（确保包含：2个橙色mRNA节点 + 28个蓝色miRNA节点）。

Node_Name	Node_Type
AURKA	mRNA
EZH2	mRNA
hsa-miR-125a-5p	miRNA
…（其余27个miRNA）	miRNA

步骤3：制作Table S5（mRNA-miRNA调控关系详情）

基于StarBase下载的mRNA_miRNA_regulation.tsv，整理为表格，示例格式如下：

miRNA_Name	Target_Hub_Gene	Supported_Databases（数量/名称）	Binding_Site（结合位点）	Seed_Region（种子区）
hsa-miR-125a-5p	AURKA	4（TargetScan, miRDB, PITA, RNA22）	3’UTR（3’非翻译区）	UCCCUGAG
hsa-miR-26b-5p	EZH2	3（TargetScan, miRDB, PITA）	3’UTR	UUCAAGU
…（共28个miRNA）	…	…	…	…

数据来源：StarBase结果中的「Binding Site」（通常为mRNA的3’UTR）和「Seed Region」（miRNA的种子序列，调控关键区域）。

四、关键注意事项（确保结果准确）

数据库参数一致性：
- ChIPBase的“置信度评分”和StarBase的“支持数据库数量”需严格筛选，避免低可信度调控关系导致网络冗余；
- 物种统一为「Homo sapiens」，避免跨物种数据偏差（如小鼠miRNA与人类mRNA的结合关系无意义）。
Cytoscape样式统一：
- Fig11A和Fig11B的mRNA节点颜色需保持一致（均为橙色），确保读者视觉连贯；
- 节点大小按“重要性”设置（Hub基因>TF/miRNA），突出核心调控分子。
表格信息完整性：
- Table S4/S5需包含“调控关系的支撑证据”（如ChIP-seq细胞系、支持数据库），增强结果可信度，符合论文补充材料要求。