
NGS
文章平均质量分 78
毒鸡蛋
这个作者很懒,什么都没留下…
展开
-
F1R2 和 F2R1 的定义
在双端测序中,每个 DNA 片段的两端都会被测序,生成两个读取(Reads),分别称为 Read 1 (R1) 和 Read 2 (R2)。对于链特异性文库,这两个读取不仅包含序列信息,还携带了关于原始转录本链方向的信息。含义:表示第一个读取(Forward Read 1, R1)是从正链(+ strand)测序而来,而第二个读取(Reverse Read 2, R2)是从负链(- strand)测序而来。应用场景:当构建链特异性文库时,F1R2 是指 R1 来自正链,R2 来自负链。原创 2025-01-15 10:17:55 · 355 阅读 · 0 评论 -
对 fastq 和 bam 进行 downsample
每次读取被保留的概率为P,因此,使用完全相同的输入以相同的顺序和RANDOM_SEED的相同值执行的运行将产生相同的结果。其次,比较了两个重复之间的一致性,发现设置相同的随机种子和频率时,得到的两个文件完全一致,MD5检验值相同。最后,比较了时间上的差异,采用相同的计算资源,Picard要比samtools至少节约80%的时间。可以指定一个整数提取一定数目的reads,也可以指定一个小数提取一定比例的reads。–ACCURACY/-A, 算法的精度,误差尽可能保证在该精度范围,默认1e-4。原创 2023-09-08 14:28:17 · 1339 阅读 · 0 评论 -
insert size、fragment、 inner 的解释,Filter BAM/SAM files by insert size
SAM 文件的第九列,即观察到的模板 LENgth (TLEN),可用作fragment 长度的近似值。这是近似值.原创 2023-04-04 17:02:33 · 949 阅读 · 0 评论 -
NGS 分析流程 (一)
NGS 一般流程文章目录NGS 一般流程1、fastq 数据质控清洗2、fastq 数据比对到 bam3、bam 数据 碱基校正一、二、总结1、fastq 数据质控清洗fastp调用示例如下(示例):tumor_fq1=$1tumor_fq2=$2tumor_fastq_r1=$3tumor_fastq_r2=$4task_cpus=$5fastp -i ${tumor_fq1} -I ${tumor_fq2} \-o ${tumor_fastq_r1} -O ${tumor_原创 2020-10-31 14:22:57 · 2218 阅读 · 0 评论 -
NGS 分析流程 (二)
NGS 分析流程 bam ---> vcf一、Call Somatic1.将bed分割,以提高效率2. Mutect2: Call Somatic3.整合过滤二、Call Germline一、Call Somatic1.将bed分割,以提高效率代码如下(示例):ref_fa=$1 # b37_Homo_sapiens_assembly19.fastatarget_bed=$2 split_region_count=$3 # 5out_path=$4 # split_inter.原创 2020-10-31 15:45:04 · 657 阅读 · 0 评论 -
NGS 分析流程 (三)
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档NGS 分析流程 (三)一、注释1. SnpEff 注释2. bedtools过滤一、注释1. SnpEff 注释代码如下(示例):all_marked_vcf=$1prefix_anno_vcf=$2isoform_v1.0.txt="isoform_v1.0.txt"java -Xmx4g -jar /home/sunxj/software/SnpEff/target/SnpEff-4.4-jar-with原创 2020-10-31 18:25:11 · 505 阅读 · 0 评论 -
NGS 分析流程 (四)
NGS 分析流程 (二)前言一、pandas是什么?二、使用步骤1.HaplotypeCaller2.读入数据总结前言提示:这里可以添加本文要记录的大概内容:例如:随着人工智能的不断发展,机器学习这门技术也越来越重要,很多人都开启了学习机器学习,本文就介绍了机器学习的基础内容。提示:以下是本篇文章正文内容,下面案例可供参考一、pandas是什么?示例:pandas 是基于NumPy 的一种工具,该工具是为了解决数据分析任务而创建的。二、使用步骤1.HaplotypeCaller代码如下原创 2020-11-01 15:18:21 · 672 阅读 · 1 评论