生信(五)awk求取某一列的平均值

关键词:awk

awk是生信人必须要掌握的命令行工具。为啥?因为它太强大了。我们举一个例子来说明。

假设我们有一个1000万行的文件,大概长这样:
在这里插入图片描述

怎么求第四列的平均数呢

Python版本
我们可以用几行Python代码解决,比如这样:
在这里插入图片描述

其耗时:
在这里插入图片描述

R版本
用R来做计算也是很适合的,比如像这样:
在这里插入图片描述

其耗时:
在这里插入图片描述

awk版本
awk用一行代码就可以解决问题,像这样(注意耗时):
在这里插入图片描述

至此,我们可以看出,awk代码简单,但是性能却不差!在同样的机器上处理同样的文件,awk的运行时间是Python的一半左右,是R的大概十分之一。可以说,awk已经非常快了

C版本
都说C快,让我们看看到底有多快。代码如下:
在这里插入图片描述

在这里插入图片描述

其耗时:
在这里插入图片描述

可以看出,C的版本也仅比awk的稍快一点点。但是,C的代码复杂多了!由此,我们可以粗略比较出awk是一个非常完美的文本处理工具!

如果有任何问题,欢迎交流!

(公众号:生信了)
在这里插入图片描述

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值