illumina 肿瘤分析流程

本文介绍了如何将本地Win电脑上的Illumina肿瘤分析流程部署到Linux服务器,涉及DNA分析的bwa比对、bam文件处理、variant calling等步骤。在Linux上,由于数据拆分和合并的不同,部分脚本需要调整,如TranslateBam、Indel重排序和合并reads。此外,文中提到了Pisces、Nirvana等软件在不同阶段的应用,以及基因组资源和注释数据库的更新问题。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

本地 Win 电脑部署了一套 ILLUMINA 的肿瘤分析流程,有 DNA 和 RNA 两个流程。需要将这套分析流程部署到 Linux 服务器上。

通过查看日志,发现 DNA 的 Workflow 主要有以下几个部分:

  1. 数据拆分
    • 数据拆分: 通过 bcl2fastq 拆分数据(现有流程已有拆分步骤,可忽略);
  2. bam 文件处理
    • bwa比对: 将 fastq 文件比对到基因组;
    • TranslateBam: 作用未知,似乎是通过 target 文件对 bam 文件区域做了限定;
    • indel重排序:对 bam 文件中的 indel 进行重新对齐,不清楚是左对齐还是右对齐
    • 合并reads:合并 overlap paired-end read;
  3. VariantCalling
    • call 变异: 使用 Pisces 进行 call 变异;
    • 突变质量重矫正: 对结果 vcf 结果进行重矫正
  4. 结果注释及统计
    • 结果注释:对 vcf 结果进行数据库注释
    • bam文件统计:对 bam 文件进行统计,但是使用的 puma.exe 无法在 Linux 上运行。也找不到相关资料
    • 突变结果统计:对最终 vcf 结果进行统计,但并没有结果文件生成

软件依赖

流程脚本基本是 dll 脚本,可以通过安装.NET Core来跨平台运行。

有一些脚本,在网上找不到下载地址,是直接从 Win 电脑上复制过来的,需要修改相应的XXX.runtimeconfig.json,将frameworkversion参数从1.0.0改成自己安装的.NET Core版本,比如我现在装的是2.1.7

另外针对所有的dll脚本,需要在XXX.runtimeconfig.json添加一项configProperties配置,具体如下:

{
  "runtimeOptions": {
    "tfm": "netcoreapp2.0",
    "framework": {
      "name": "Microsoft.NETCore.App",
      "ver
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值