不用R包分析NIPT

当无法使用R包处理从NCBI下载的优讯医学NIPT数据时,可以通过手动操作进行分析,包括比对、排序、过滤、GC校正等步骤。使用deeptools的faToTwoBit工具进行2bit格式的参考基因校正,并采用loess算法。后续通过提取reads数、计算Z值和批量运行完成分析。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

比如从NCBI上面下载的优讯医学上传数据,发现用R包用不了时,可以这么做:

1.进行比对 

# bwa mem 目前用的比较多
bwa mem -t 16 -M -Y hg19.fa SRR6040607.fastq.gz | samtools view -bSh -t 16 -f bam > SRR6040607.bam


#或者用:
bwa aln -n 0 -e 0 -k 0 -t 16 hg19.fa SRR6040607.fq.gz > SRR6040607.sai   # 容错率为0
bwa samse -n -1 hg19.fa SRR6040607.sai SRR6040607.fq.gz > SRR6040607.sam  # 根据坐标转换为sam文件
samtools view  SRR6040607.sam -bSh > SRR6040607.bam   # 把sam文件转为bam -s sam -b bam

2.排序

samtools sort -@ 16 SRR6040607.bam -o SRR6040607.sorted.bam    # -@ 表示16线程
samtools index SRR6040607.sorted.bam

3.过滤

samtools rmdup -s SRR6040607.sorted.bam SRR6040607.rmdups.bam   
samtools view -F 4 SRR6040607.rmdups.bam -bSh > SRR6040607.final.bam   
samtools index SRR6040607.final.bam    # 对于后面的GC校正时必须的

4.GC校正

使用deeptools里的工具faToTwoBit进行校正,deeptools需要2bit格式的参考基因。
目前流行用loess算法校正
安装fa

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值