linux shell命令awk 提取文档第一列内容

本文介绍了一种从文本文件中提取指定列的方法,并演示了如何利用awk命令完成这一任务。此外,还提供了如何对提取的数据进行去重处理的具体步骤。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

1. 原文档内容格式:

词组 拼音 次序
阿爸 a1'ba4 18137
阿昌族 a1'chang1'zu250849
阿斗 a1'dou3 42632
阿飞 a1'fei1 48603
阿富汗 a1'fu4'han43461
阿訇 a1'hong1 34432
阿拉伯数字 a1'la1'bo2'shu4'zi435937
阿拉伯语 a1'la1'bo2'yu330476
阿妈 a1'ma1 16220
阿门 a1'men2 47913
阿Q a1'qiu1 20845
阿司匹林 a1'si1'pi3'lin240294
阿嚏 a1'ti4 54643


2. 共3列内容,现在只提取第一列词表,并存入另一文件:

awk '{print $1}' ./CH_word_ls.txt > ./out.txt
其中 ./CH_word_ls.txt是输入文件名 


3. 如果想提取前两列,只需

awk '{print $1,$2}' ./CH_word_ls.txt > ./out.txt

4. 然后对文本进行去重并输出到文件CH_words:

sort out.txt | uniq > CH_words




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值