例如, 抽取5%的样本
gawk '{if(rand()<0.05){print }}' text_file.txt > text_file_out.txt
其中rand()是gawk的一个随机数生成程序, 具体的可见其manpage
gawk '{if(rand()<0.05){print }}' text_file.txt > text_file_out.txt
其中rand()是gawk的一个随机数生成程序, 具体的可见其manpage
本文介绍如何利用gawk脚本抽取文本文件中5%的样本,通过随机数生成函数rand()实现这一操作,从而有效地进行数据抽样。
20

被折叠的 条评论
为什么被折叠?