生物信息学中的Linux基础与序列质量检测
1. Linux基础:编写Shell脚本分割序列文件
在生物信息学中,有时需要将所有序列读取从一个文件分离到各个独立的文件中。在类UNIX系统(包括Linux)中,Shell是连接用户和计算机的重要工具,它是一个命令解释器,能将用户指令解释给内核以进一步执行。
Linux中有多种类型的Shell,如Bourne Shell(SH)、C Shell(CSH)、Korn Shell(KSH)、TC Shell(TCSH)和Bourne Again Shell(BASH)。其中,BASH最为流行,因为它融合了KSH和CSH的有用特性。
要编写Shell脚本,我们需要使用文本编辑器,如‘pine’、‘pico’和‘vi’。这里将使用‘vi’编辑器,它最初是为Unix操作系统创建的面向屏幕的文本编辑器,也是Linux用户编辑文本文件或脚本最常用的编辑器。
以下是创建一个将多FASTA文件分割成单个FASTA文件的Shell脚本的步骤:
1. 打开终端,输入以下命令创建并打开一个名为 split.sh 的新文件:
$ vi split.sh
- 由于文件默认以命令模式打开,按‘i’或‘a’键进入插入模式,然后输入以下内容:
#!/bin/bash
INPUT_FILE=$1
PREFIX=$2
csplit -z $INPUT_FILE '/^>/'
超级会员免费看
订阅专栏 解锁全文
1848

被折叠的 条评论
为什么被折叠?



