- 博客(28)
- 资源 (3)
- 收藏
- 关注
原创 开箱即用版本 满分室间质评之GATK Somatic SNV+Indel+CNV+SV(20240430更新)
使用校准表对bam碱基质量校准,因为这一步gatk效率感人,所以同时计算insertsize,拆分interval list(后续mutect2并行运行需要),运行cnvkit batch,运行samtools depth计算测序深度,samtools flagstat 统计mapping比例及质量。编写脚本处理cnvkit输出,计算cnv基因,exon位置,gain/lost,cn数。编写脚本处理manta的输出,获取最终sv输出结果,起始位置,基因、频率等。使用cnvkit提供工具输出分布图和热图。
2023-10-07 09:57:40
668
原创 UbuntuDDE 23.04发布,体验DeepinV23的一个新选择
从V20开始的这套UI风格,窗口大圆角(默认设置,可修改),宽标题栏,高饱和度鲜艳的图标,整体上给人的感觉是浓艳但是不耐看。deepin的V23还在beta测试版,从论坛上看还不太稳定,没想到Ubuntu倒是效率挺高。虽然官方论坛里deepin V23这个分开的dock栏有不少人吐槽,但没想到官方对这样的设计是认真的,而且是看样子设计已经定稿了,日期和时间和常用图标分成两行排列…整体继承了Deepin V20上DDE的风格,细节上作了一些优化,比如标题栏左侧那个侧边栏按钮,点击可以隐藏侧边栏。
2023-08-23 11:53:24
1921
原创 GATK Germline_SNP_INDEL_2.0 分析遗传病(耳聋)
GATK Germline SNP INDEL 2.0 遗传病分析(耳聋)
2022-12-12 22:30:30
746
原创 新冠病毒分型和突变分析(SARS-CoV2_ARTIC_Nanopore)
SARS-Cov2 新冠病毒分析 Nanopore Artic 生信分析流程新冠病毒分型 新冠病毒突变分析
2022-11-30 23:31:46
1383
原创 新冠病毒分型和突变分析(SARS-CoV2_ARTIC_Illumina)
SARS-CoV2 SARS-CoV-2 Illumina 新冠病毒分型和突变分析
2022-11-09 17:26:51
1187
2
原创 使用程序模拟肿瘤Normal配对数据
灵敏度低容易漏检,灵敏度高伴随着假阳性率高,假阳性可以通过其他手段去除。类比于GATK,整体准确率可能优于Varscan2,但是容易出现漏报,在临床诊断类似应用场景(NIPT,肿瘤伴随诊断,早筛),整体上保证准确率的情况下(如不低于95% ),从策略上倾向于尽可能多报阳性,包括部分假阳性,阳性还可以通过其他临床方式来确认,尽可能避免漏报,漏报没有补救措施。要实现文中pipeline的功能,缺少定制panel的bed文件,这里尽可能的用一个类似的替换,例如:lang.cancer_hg38.bed。
2022-10-25 17:20:04
429
原创 靶向分析流程(Pipeline)中的数据质控
从输出文件${sn}_fastp.json文件中获取过滤前后Q20,Q30比例,总的reads从输出文件${sn}_marked.flagstat文件中获取mapping的一些信息,比如mapping比例,比对到参考基因组上的比例输出所有区域文件${ref.bed}位点的测序深度,然后统计整体的测序深度,比如1× 10× 20× 等测序深度下的覆盖率,总体的平均测序深度和中位数测序深度gatk CollectInsertSizeMetrics (其实是整合进去的pcard)...
2022-08-28 21:15:01
651
原创 NMPA已注册肿瘤小Panel试剂盒生物信息学分析内容对比
Illumina Sequencing Analysis Viewer v2.4.5 分析每批次数据Q30比例Q30≥75%通过;
2022-08-13 19:56:17
507
原创 基于docker的生信基础环境镜像构建
这里参考snakemake的写法,每个分析步骤创建一个yaml文件,里面是用到的软件及版本。首次运行检测该步骤环境存在,不存在先安装软件初始化。fastqc.yaml文件如下,文件位于/opt/config目录下。
2022-08-11 22:24:51
736
原创 重新设计的文件管理器
软件版本:Sliverworkspace 2.0.386439重新设计的文件管理器,大幅提高性能,操作更便捷;支持文件上传、重命名、 移动、删除拖动文件时弹窗等待。Bug修复:修复使用文件管理器服务器节点连接没有及时释放的bug;解决之前前端渲染速度过慢问题,更换底层渲染逻辑。 重新设计的文件管理器 ...
2022-05-08 10:46:24
257
原创 转录组RNA-Seq使用docker+bioconda实现分析环境搭建
转录组RNA-Seq使用docker+bioconda搭建分析环境前言近期学习转录组分析,从ncbi下载数据,转成fastq,STAR/hisat2 map到基因组上,使用featureCount拿到表达矩阵文件挺顺利的,就是到了下游分析,开始使用R开始遇到了各种问题。原因是之前一直使用的一个docker 环境是基于ubuntu 16.04的,上面的R版本是3.2.3,在进行下游分析的时候各种R包安装不上,原因也是R版本太旧。经历了各种问题之后终于忍无可忍,决心重新构建一个RNA-Seq的docker
2020-10-10 22:04:44
1765
4
原创 GATK RNA-Seq Snps Indel 分析
这是GATK Best Practice系列学习文章中的一篇,本文尝试使用:Gatk RNA -Seq Germline spns-indels Pipeline 来分析鼻咽癌(NPT)分析流程如下:GATK版本的是这样的数据从NCBI上下载转录组数据,访问链接为:https://trace.ncbi.nlm.nih.gov/Traces/study/?acc=SRP058243&o=acc_s%3Aa第一个样本的数据下载链接如下:LocationName Link
2020-09-21 17:14:38
2433
5
原创 Gatk Germline spns-indels Pipeline 分析遗传病(耳聋)
这是GATK Best Practice系列学习文章中的一篇,本文尝试使用Gatk Germline spns-indels Pipeline来分析遗传病(耳聋)数据这次没有拿到遗传病的室间质评的数据,直接从NCBI上找一些数据来分析。NCBI上搜索deaf,点击第一条搜索结果,最后几经跳转找到数据下载页面:https://trace.ncbi.nlm.nih.gov/Traces/sra/?study=SRP218677可以看到:Targeted next generation sequencing
2020-09-11 14:49:50
820
原创 满分室间质评之GATK Somatic SNV+Indel+CNV+SV(下)性能优化
我们接上文:满分室间质评之GATK Somatic SNV+Indel+CNV+SV一文中实现了对于卫计委室间质评数据分析以及与满分结果的匹配。本文将着重解决,保证最终结果一致的情况下,如何优化分析性能(并行化),如何将分析时间从 3h 59m 53s缩短至 1h 10m 38s。优化的方向:实际运行GATK4.X的工具如Mutect2时,发现其运行效率相当低,从CPU占用率,内存占用,硬盘I/O都占用很低,起初自己DIY时候,将要分析的bed/interval_list文件按照染色体编号拆分(不太确定
2020-08-04 15:56:28
3269
原创 满分室间质评之GATK Somatic SNV+Indels+CNV+SV(上)
卫计委在2017年,2019年,2020年(还没有答案)提供标准数据用于肿瘤生信分析的室间质评。这样预知结果的数据自然是不能放过了,本文尝试参考GATK Best Practice:Somatic SNVs + Indels ,Cnvkit,Manta的pipeline来完成满分流程分析,也可以使用标准数据反向判断GATK Mutect2的实际准确度,算法优劣。注:本文仅用于学习,距离真正的临床应用还有相当大距离,欢迎大佬批评指正**1. 分析流程概览如下:2. 本文用到的分析系统及分析流程文件
2020-07-31 14:02:18
3660
2
原创 图形化开放式生信分析系统开发 - 1 需求分析及技术实现V2(2020.7更新)
起因/背景从2017年前开始,工作的原因接触到了NGS(高通量测序技术 High-throughput sequencing又称“下一代”测序技术"Next-generation" sequencing technology)技术和相关的生物信息学分析。应用方向是肿瘤的临床诊断,几年间随着技术的快速迭代,应用范围和模式都发生了巨大变化:从最早的肿瘤组织石蜡切片样本过渡到血液样本ctDNA(circulating tumor DNA)的检测,从单一癌种十几个基因的小Panel分析过渡到范癌种几百个基因的大
2020-07-29 16:23:23
659
4
原创 使用docker完成生信分析环境搭建
生信开发人员最头疼的问题,可能就是平台搭建和软件安装了。部署和迁移上要费很大力气。本文讲述使用docker制作一个镜像,后续通过导入自己定制的镜像,复制文件完成分析流程的部署和迁移。如何使用docker,推荐阅读 Docker — 从入门到实践一、准备工作首先我们需要对手头的pipeline做一个分类。为了保持docker镜像尽可能的小,不能将所有文件全部放在docker镜像里面,需要外...
2019-12-12 11:43:57
1528
1
原创 图形化开放式生信分析系统开发 - 9 Illumina测序仪测序数据自动拆分
前文链接:图形化开放式生信分析系统开发 - 1 需求分析及技术实现图形化开放式生信分析系统开发 - 2 样本信息处理图形化开放式生信分析系统开发 - 3 生信分析流程的进化图形化开放式生信分析系统开发 - 4 生信分析流程的图形化图形化开放式生信分析系统开发 - 5 生信分析流程服务器端运行图形化开放式生信分析系统开发 - 6 生信分析流程批量运行与过程控制图形化开放式生信分析系统...
2019-12-05 10:05:54
2453
原创 图形化开放式生信分析系统开发 - 8 软件稳定性测试
前文链接:图形化开放式生信分析云平台产品开发 - 1 需求分析及技术实现图形化开放式生信分析云平台产品开发 - 2 样本信息处理图形化开放式生信分析云平台产品开发 - 3 生信分析流程的进化图形化开放式生信分析云平台产品开发 - 4 生信分析流程的图形化图形化开放式生信分析云平台产品开发 - 5 生信分析流程服务器端运行图形化开放式生信分析云平台产品开发 - 6 生信分析流程批量运行...
2019-12-02 15:46:51
460
原创 图形化开放式生信分析系统开发 - 6 生信分析流程批量运行与过程控制
前文链接:生信分析云平台产品开发 - 1 需求分析及技术实现生信分析云平台产品开发 - 2 样本信息处理生信分析云平台产品开发 - 3 生信分析pipeline的进化生信分析云平台产品开发 - 4 生信分析pipeline的图形化生信分析云平台产品开发 - 5 生信分析pipeline服务器端运行在上文生信分析云平台产品开发 - 5 生信分析pipeline服务器端运行 解决了...
2019-12-02 14:59:10
550
原创 图形化开放式生信分析系统开发 - 5 生信分析流程服务器端运行
前文链接:图形化生物信息分析系统开发 - 1 需求分析及技术实现图形化生物信息分析系统开发 - 2 样本信息处理图形化生物信息分析系统开发 - 3 生信分析pipeline的进化图形化生物信息分析系统开发 - 4 生信分析pipeline的图形化在上文图形化生物信息分析系统开发 - 4 生信分析pipeline的图形化 讨论了生信分析pipeline的图形化,如何用图形的方式显示...
2019-12-02 14:58:02
831
原创 图形化开放式生信分析系统开发 - 7 分析报告的模板定制与自动生成
前文链接:图形化开放式生信分析云平台产品开发 - 1 需求分析及技术实现图形化开放式生信分析云平台产品开发 - 2 样本信息处理图形化开放式生信分析云平台产品开发 - 3 生信分析流程的进化图形化开放式生信分析云平台产品开发 - 4 生信分析流程的图形化图形化开放式生信分析云平台产品开发 - 5 生信分析流程服务器端运行图形化开放式生信分析云平台产品开发 - 6 生信分析流程批量运行...
2019-12-02 14:34:24
746
原创 图形化开放式生信分析系统开发 - 4 生信分析流程图形化设计
前文链接:自动化图形生物信息分析系统开发 - 1 需求分析及技术实现自动化图形生物信息分析系统开发 - 2 样本信息处理自动图形化开放式生信分析系统开发 - 3 生信分析pipeline的进化在上文自动图形化开放式生信分析系统开发 - 3 生信分析pipeline的进化 讨论了生信分析pipeline的进化,从手动到自动,但仍然停留在终端命令行阶段,为了让更多非生信专业的人能够使用...
2019-12-02 14:33:18
1293
原创 图形化开放式生信分析系统开发 - 3 生信分析流程的进化
接上两篇内容,本文主要讲述工作中NGS从科研进入医学临床领域,工作中接触到生信流程,以及最终在自动图形化开放式生信分析系统开发中生信workflow设计实现的过程。接触二代测序,生信分析,那真是打开了一个新世界的大门,各种名次术语满天飞,搞的头晕脑胀。什么“什么是高通量测序/NGS”、Sanger法测序(一代测序)、外显子测序(whole exon sequencing)、mRNA测序 (...
2019-12-02 14:32:55
1310
原创 图形化开放式生信分析系统开发 - 2样本信息处理
一、基于生信分析云平台的需求,在下图中可以看出样本信息在整个软件中的作用样本信息用于数据拆分、运行运行流程、分析报告,是整个系统的基础数据之一。下面来具体归纳一下样本信息在软件系统的作用并列出详细的数据字段:1、用于标记分析运行状态的 序号 字段名称 数据类型 作用 1 ...
2019-12-02 14:32:27
814
原创 图形化开放式生信分析系统开发- 1基本需求分析及技术实现
我的生信生产系统开发过程- 1简单需求分析及技术实现起因背景几张图片下面进入正题,以具体个人工作经历为例,分析归纳出需求:我司技术上,陆陆续续完成了十几个项目,十几条pipeline,生信大佬们写的那些500行的shell脚本,基本上要求使用运行人员处在一定技术水平(熟悉Linux系统,熟悉shell,perl,python,R编程中的一种),这就限制了使用范围。后来公司基于脚本的基础上也实现了部...
2019-12-02 14:32:01
3012
2
sliverworkspace-community.tar.gz
2020-09-18
sliverworkspace-community.tar.gz
2020-09-18
Muiii White For Linux 白色版
2020-05-03
Muiii鼠标Cursor皮肤for Linux.zip
2020-05-03
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人