shuf 随机选取txt文件特定行数

本文介绍如何使用命令行工具将多个文本文件合并成一个文件,并演示如何从中随机选取特定数量的行。通过具体示例展示了如何利用cat命令进行文件合并,以及如何使用shuf命令实现行的随机抽取。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

一, 多个 txt 文件合并为一个txt 文件

        现有 neg_12.txt  ,  part_12.txt   , pos_12.txt  三个文件 , 合并为一个名为 train.txt的文件

cat neg_12.txt part_12.txt pos_12.txt > train.txt

就会在目录下生成一个 包含 上面三个文件内容的 train.txt文件。

二 ,随机选取 train.txt 中指定行数

       查看 shuf 命令帮助 “shuf --help”

用法: shuf [选项]... [文件]
 或者:  shuf -e [选项]... [参数]...
 或者:  shuf -i LO-HI [选项]...
Write a random permutation of the input lines to standard output.

如果没有指定文件,或者文件为"-",则从标准输入读取。

必选参数对长短选项同时适用。
  -e, --echo                treat each ARG as an input line
  -i, --input-range=LO-HI   treat each number LO through HI as an input line
  -n, --head-count=COUNT    output at most COUNT lines
  -o, --output=FILE         write result to FILE instead of standard output
      --random-source=FILE  get random bytes from FILE
  -r, --repeat              output lines can be repeated
  -z, --zero-terminated     line delimiter is NUL, not newline
      --help		显示此帮助信息并退出
      --version		显示版本信息并退出

可以根据帮助信息进行操作 ,如随机选取train.txt中的200行保存在新文件 test.txt中

shuf train.txt -n 200 -o test.txt
则在test.txt中为train.txt中随机打乱后的200行数据。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值