扩增子流程·测序文件的批量改名

文章介绍了如何批量修改测序文件的名称,首先通过命令行生成文件列表,然后在Excel中利用分列功能处理文件名,创建新的命名规则,最后使用awk和Linux命令实现文件的批量重命名。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

测序文件的批量改名

公司返回的测序文件多为下图所示,可我们不需要那么长的文件名,我们只需要其中的一部分或者重新命名为我们想要的。
图1
将测序文件名改成这样
在这里插入图片描述
我们只需使用如下命令即可完成!

#首先进入到你存放测序文件的文件夹中
cd seq
#将所有.fa.gz文件名写入到一个.txt文件中,并命名为metadata.txt。
ls *.fq.gz > metadata.txt

Excel编辑列表,第二行为最终命名方式

打开metadata.txt文件,Ctrl + A全选后,复制到一个新的Excel表格中。如下图所示:

在这里插入图片描述
在这里插入图片描述

使用Excel表格中的数据-分列功能将其分离。具体步骤:Excel–数据—分列–分隔符号

在这里插入图片描述
在这里插入图片描述

结果如图

在这里插入图片描述

制作我们想要的名字,将第一列复制给第二列,同样使用数据-分列–分隔符号–其他【_】–完成。此时,将第二列再复制一遍,并保存到第三列(保护列)。

在这里插入图片描述
将其另存为为.txt格式,并放到seq文件夹目录下。

# 转换行尾换行符
sed -i 's/\r//' metadata.txt
# 检查手动命名列2是否唯一
cut -f 2 metadata.txt|wc -l
cut -f 2 metadata.txt|sort|uniq|wc -l
# 如果第二次结果是第一次的一办,则命名非冗余
# 可选移动mv,复制cp,硬链ln,或软链ln -s
# 此处使用复制cp
awk '{system("cp "$1"_R1.fq.gz "$2"_R1.fq.gz")}' metadata.txt
awk '{system("cp "$1"_R2.fq.gz "$2"_R2.fq.gz")}' metadata.txt

最终结果如图

在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值