linux 随机抽取文件中N行

本文介绍了使用shell命令、awk和Python实现随机抽取文件列数及从大数据中生成指定数量随机行的方法。通过实例展示了如何在不同场景下操作,如从t.txt文件中选取5列,以及从1000万数字中抽样10万行写入文件。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1.shell命令

直接用shuf -n5 t.txt > L则随机在t.txt 中抽取5列 到L中

2.awk
awk 'BEGIN{srand()} {print rand()"\t"$0}'  input_file | sort -nk 1 | head -n line_num | awk -F "\t" '{print $2}'
3.python
import random
import linecache 
#一个1到1000w的list列表
Random_number_list=[x for x in range(10000000)]
#从1到10W的列表中随机获取10W个数字,之后当行号 
Randon_data_line= random.sample(Random_number_list,100000)
#打开一个要写入你随机出来10W行的数据,a+相当于shell的“>>”追加写 
write_fname=open('aa.txt','a+')
#循环10w的那个列表  
for tmp_line in Randon_data_line:
#读取随机10W行数据 
    tmpdata=linecache.getline('read_data.txt',tmp_line)
#并写入到你要写入的文件aa.txt 
    write_fname.write(tmpdata)
#关闭aa.txt 
write_fname.close() 
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值