Sed与AWK:文本处理的强大工具
1. Sed实用示例
1.1 生成基因树视图
可以使用Sed命令将基因列表文件(GeneList.txt)的内容重新格式化为树状输出,这样便于数据的读取。以下是具体的命令:
$ sed -n ’s/ˆ\([A-z]..*\)/|--- \1/p
s/ˆ
\([A-Z]..*\)/|
|--- \1/p
s/ˆ
[A-Za-z]..*(\(....\))/|
|
|--- \1/p
’ GeneList.txt
执行上述命令后,输出结果如下:
|--- Energy metabolism
| |--- Glycolysis
| | |--- gap1
|--- Photosynthesis and respiration
| |--- CO2 fixation
| | |--- rbcL
| | |--- rbcS
| |--- Photosystem I
| | |--- psaD
| | |--- psaK
| | |--- psaE
| |--- Soluble electron carriers
| | |--- petE
| | |--- isiB
| | |--- petJ
| | |--- petF
这个Sed脚本的特殊之处在于第三行,使用了反向引用(back reference)来提取括号内的内容,即基因名称。同时,脚本使用了 -n 选项
超级会员免费看
订阅专栏 解锁全文
155

被折叠的 条评论
为什么被折叠?



