自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(21)
  • 收藏
  • 关注

原创 提取基因组fa某区间序列

samtools faidx 详细参数。1.samtools 提取。2.seqtk 提取。

2025-07-18 16:37:44 204

原创 Aspera下载安装使用以及wget下载数据

2025-05-22 11:07:45 232

原创 投递 sleep 占领资源

然后投递:qsub -cwd -l vf=334g,p=5,hostname=omt005 sleep.sh。

2024-11-28 10:58:05 145

原创 orthomcl 报错

orthomcl 报错

2024-11-20 17:47:45 196

原创 Tassel 实现hmp文件和vcf文件之间的转换

hapmap格式:hmp.txt。tassel的官方界面。

2024-09-11 11:51:04 2205

原创 基因组文件同时存在大写AGCT和小写agct,统一大小写

1、将序列以大写字母的形式输出。2、将序列以小写字母的形式输出。图中圈起来的是两者的区别。

2024-09-11 11:03:00 1014

原创 gz压缩文件,你应该知道的那些是事

不是所有的压缩文件都可以用gzip ,pigz进行压缩的,比如在对 vcf 文件压缩时,不可以用 gzip 来代替 bgzip,否则后续利用tabix 建索引 可能会出现错误。

2024-09-10 11:43:27 1319

原创 处理软连接的命令

压缩带软连接目录文件 tar -chzvf file.tar.gz file (其中-h为保证软链接正常压缩的参数。如果目录里无软链接,便不要添加,否则压缩文件可能会出问题, 无软链压缩命令 tar -czvf file.tar.gz file。上传带有软连的目录到桶里的命令 obsutil cp -r -f req_out/ obs://omt-hwy/01.Project/01.reseq --link 其中 -r -f 表示上传目录递归,-link 为软连接。

2024-08-13 10:29:40 251

原创 可以直接cat 多个fq.gz压缩文件

1.fastq.gz和2.fastq.gz 大小71M , 67 M 直接cat 为137 M ,zcat 可能差距较大。

2024-05-24 14:42:23 1006 1

原创 SNP----index(先减在平均)

如下图所示,参考基因组上是C碱基,G是突变碱基,覆盖左边的C的reads有10条,其中有4条reads该位点是G,那么SNP-index为0.4;分析模块,根据设定的窗口大小(SNP number)和步长(SNP number),对窗口进行滑动,计算区间内所有变异位点的SNP-Index均值。混池1在这个区间内所有变异位点SNP-Index计算结果的平均值(混池名称与输入的VCF文件中的名称一致)。混池2在这个区间内所有变异位点SNP-Index计算结果的平均值(混池名称与输入的VCF文件中的名称一致)。

2024-05-07 14:59:23 1558

原创 seqkit 那些事

参数指定要截取的范围,这里是从141到15380。执行该命令后,将会生成一个包含指定范围的子序列的输出文件。表示截取从第141个碱基到第15380个碱基的子序列。上述命令中的范围索引是以1为基准的。改为碱基全部大写的形式,改为碱基全部大写的形式。请注意,使用之前要对。

2024-03-14 18:03:30 1604

原创 Linux之snodes 查看节点使用情况详解

snodes 查看节点负载 # 输出解释:含义: 各列的具体含义解释Queue: 节点所在队列名称VirtualFree: 可用虚拟内存大小FreeCPU: 可用 CPU 数量NJOB: 在节点上运行的作业数目%LOAD: 节点负载百分比SWAP: 交换空间使用情况States: 节点状态信息。

2024-03-14 17:17:35 2125

原创 seqkit:处理数据的ACE

功能:统计、格式转换、长度筛选、质量值转换、翻译、反向互补、抽样、去重、滑窗、拆分等30项。

2024-01-24 10:46:51 690 1

原创 维恩图:你真的了解么?

维恩图一般可画在2到7组之间。因此便需要调整比较组个数维恩图用于展示在不同的事物群组(集合)之间的数学或逻辑联系,尤其适合用来表示集合 (或)类之间的“大致关系”,它也常常被用来帮助推导(或理解推导过程)关于集合运算(或类运算)的一些规律。可以画多个分组。

2024-01-24 10:17:36 1911 1

原创 fastp软件 :rawdata生成cleandata

I 大写 i 后接read1.fq.gz。-o 后接输出的clean.1.fq.gz。-O 后接输出的clean.2.fq.gz。--html 生成的html文件。-i 后接read1.fq.gz。--json 生成的json文件。

2024-01-23 17:17:46 1360 1

原创 不再虾说:shrimp 和 prawn 真的不一样?

参考:

2024-01-23 15:43:03 994 1

原创 NCBI下载整个界面和只下载序列的方法

根据要下载的内容,搜索对应的名称(拉丁名)或者编号(比如 NC_018119.1),然后就可以进入到下面的界面,就根据图片的提示下载对应的文件即可。

2024-01-23 14:59:27 1532 1

原创 linux 命令

命令是用于在 Linux 和 macOS 系统上创建 ZIP 格式的压缩文件。如果你在 Windows 系统上使用,可以使用类似的命令,但命令参数可能会稍有不同。压缩文件中的所有文件和目录的详细信息,包括文件名、大小、压缩比等。在打包时跟随软链接,将链接指向的文件也包含在压缩文件中。参数表示递归地将目录及其内容包含在压缩文件中。要打包压缩含有软链接的文件或目录,可以使用。要查看压缩后的文件内容,可以使用。替换为你要打包的实际目录路径,参数表示创建新的压缩文件,参数显示详细的打包过程,

2024-01-23 11:48:12 1060 1

原创 HMMER 隐马尔可夫模型序列最新下载方法

注意:这是一个二进制文件,和之前pfam数据库的文件有差别。下载的文件加后缀.gz,然后解压这个文件,gunzip。interpro网页说明。

2024-01-09 16:08:57 1756 1

原创 截图工具分享

Ploacode的使用主要是在VS Code平台上,需要安装该插件。直接通过VS Code左侧扩展栏查找并进行安装即可,当然这个我也没用用过,大家可以试一下。我常用的软件:snipaste 这个软件免费,好用!

2024-01-09 16:07:16 430 1

原创 关于Minia软件的使用,二代数据,三代数据等组装

kmer-size参数:该参数用于指定kmer大小,即在组装过程中使用的短序列片段的长度。一般来说,常用的kmer大小范围在15-31之间,具体取决于你的数据集和实验目的。-nb-cores参数:该参数用于指定使用的CPU核心数,即同时运行的线程数。除了这两个参数,Minia还有其他一些重要的参数,例如输入文件路径(-in)、输出文件前缀(-out)、内存限制(-mem)等。Minia软件有许多参数和选项可以用于调整组装过程,其中两个常用的参数是-kmer-size和-nb-cores。

2024-01-09 16:02:10 952 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除