- 博客(18)
- 收藏
- 关注
原创 make安装报错
1. 在make的过程中 bzlib.h: No such file or directory。2. 如果还报其他的错误 直接conda deactivate。解决办法 找到bzlib.h所在的位置 直接ln -s 过来。
2024-01-26 11:40:07
571
原创 ragout 基因组拼接
ragout 可以将denovo 组装的片段基因组 拼接成一整条长基因组conda 可以直接下载https://github.com/fenderglass/Ragout自己下载要依赖的东西太多,等着conda就行。输入 一个自己写的file a.rcp;把 references 路径和scaffolds路径放进去.references = reference .target = scaffolds reference.fasta = references/reference.fasta ...
2022-01-03 10:40:53
619
原创 安装bcftools
以为conda是万能的 就是bcftools 老说我缺lib 又没有root权限安装不了于是然后就卸了 conda remove -- force bcftools (防止那些依赖的软件也被卸掉)重新装 在网址下载SAMtools/BCFtools/HTSlib - Downloads下载完 就make就行了 省的没权限 全改自己路径下就行了./configure --prefix=/where/to/installmakemake install -C /where/to/...
2021-10-07 23:48:55
2249
原创 使用别人的perl 指定自己的安装路径模块
使用别人的perl指定自己的安装路径在自己的环境变量里加上这一句,然后source .bashrc 就可以直接用cpanm安装了echo 'eval "$(perl -I/ldfssz1/xxx/bin/perl -Mlocal::lib=/ldfssz1/xxx/software/perl)"' >> ~/.bashrc...
2021-07-01 16:08:16
519
原创 根据fasta序列call SNP----snippy-multi
while read a ; do echo "$a /ldfssz1/ST_INFECTION/P18Z10200N0164_Resistance_PN/User/leixiaole/02.project/00.XYhospital/14.newtreeWAS/02.snp/FEP/certificate/02.fastp/${a}/scaffolds.fasta" >> ID1000_scaffolds; done < ../07.pheno/ID1000#od -c 看文件是否有\
2021-07-01 16:00:12
3004
1
原创 linux下R使用多个library
如果你懒得安装packages可以直接用别人的lib路径可以多加几个export LD_LIBRARY_PATH="/home/sunwanying/R/x86_64-pc-linux-gnu-library/3.3/libs/":$LD_LIBRARY_PATH以treewas为例缺了一个phangorn包,而且treewas是较早的版本,直接install.packages()不行,版本不对,这时候可以去R官网(官网路径 https://cran.r-project.org/src/...
2021-04-21 15:08:23
1009
原创 shovill 使用
Main steps : Estimate genome size and read length from reads (unless --gsize provided) Reduce FASTQ files to a sensible depth (default --depth 100) Trim adapters from reads (with --trim ...
2018-08-08 16:48:23
813
原创 共线性synteny使用---提取毒力基因
从NCBI上下载所需要的ref 的gene feature 提取毒力基因 所用脚本: open IN,"<", $ARGV[0] or die$!; $/ = '>'; print '>'; whil...
2018-08-01 14:44:11
895
原创 snippy
软件结果: 先得到raw snp ### freebayes-parallel reference/ref.txt 8 -p 1 -q 20 -m 60 --min-coverage 10 -V -f reference/ref.fa snp.bam > snp.raw.vcf 然后用filter 过滤掉了质量差的 ### /l...
2018-08-01 14:43:26
1758
转载 多位点序列分型
多位点序列分型(Multilocus sequence typing,MLST)是一种基于核酸序列测定的细菌分型方法,通过PCR扩增多个管家基因内部片段,测定其序列,分析菌株的变异,从而进行分型。MLST是由多位点酶电泳(MLEE)衍生出来的一种分型方法,由Maiden等研究设计,于1998年首先应用于自然变异是的脑膜炎奈色球菌(Neisseria meningitides),后来被广泛应用...
2018-08-01 14:42:52
4190
原创 Resistence gene identify
他要依赖很多东西https://github.com/arpcard/rgi 它比对会用到blast或者diamond ,使用这个软件要注意很多东西。usage: rgi main [-h] -i INPUT_SEQUENCE -o OUTPUT_FILE [-t {read,contig,protein,wgs}] [-a {DIAMOND,BLAST}...
2018-08-01 14:42:19
858
1
原创 下机数据处理
FASTQC基本格式# fastqc [-o output dir] [--(no)extract] [-f fastq|bam|sam] [-c contaminant file] seqfile1 .. seqfileN # 主要是包括前面的各种选项和最后面的可以加入N个文件 # -o --outdir FastQC生成的报告文件的储存路径,生成的报告的文件名是根据输入来定的 # --ex...
2018-08-01 14:41:49
2469
转载 数据质量什么叫做好,以及Trimmomatic sickle等过滤软件的比较
在二代测序合成的过程中随着合成链的增长,DNA聚合酶的效率会不断下降,特异性也开始变差,这就会带来一个问题——越到后面碱基合成的错误率就会越高,以下几个指标用于观察数据的质量情况read各个位置的碱基质量值分布 :大于30且波动较小碱基的总体质量值分布:大部分高于20read各个位置上碱基分布比例,目的是为了分析碱基的分离程度,AT CG在1%以内GC含量分布read各位置的N含量,一般不该出现r...
2018-07-04 10:39:57
2836
原创 数据质控软件sickel的安装与使用
安装 wget https://github.com/najoshi/sickle/archive/master.zipunzip后进入目录make ###哇头一次安装软件那么简单在 .bashrc中 alias sickle='your path/sickel'使用
2018-07-03 16:05:28
1920
原创 数据质控软件Raspberry的安装与使用
安装 按github上的官方安装说法,cmake时总是出错,实在是不知道哪里有问题,在脑子不清醒的状态下竟然一不小心 装好了,以下是具体步骤 wget https://github.com/CEG-ICRISAT/Raspberry/archive/master.zip unzip master.zip cd /Raspberry-master/incl...
2018-07-03 15:05:45
291
原创 如何用Linux从NCBI批量下载数据
https://hk.saowen.com/a/83427d3adb55f026875b2643c9398d2afceaa7d6e0f66901a0c18b52313643de
2018-07-02 16:00:46
7534
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人