1、Linux
1、两文件的处理,交集并集
#交集 sort a.txt b.txt | uniq -d #并集 sort a.txt b.txt | uniq #差集 #a.txt-b.txt: sort a.txt b.txt b.txt | uniq -u #b.txt - a.txt: sort b.txt a.txt a.txt | uniq -u
2、awk
https://blog.youkuaiyun.com/zhangcongyi420/article/details/125692179 #求一列的和 cat tt.txt | awk 'BEGIN{sum=0}{sum += $1}END{print sum}' #求第一列和第二列的乘积 cat tt | awk 'BEGIN{sum=0}{sum += $1*($2-1)}END{print sum}' #输出第一行 awk'NR==1'
3、样本抽取合并
# 方法一:从test.txt中随机抽取1000条,存入sample_1000.txt,直接在终端运行 $ shuf -n 1000 test.txt > sample_1000.txt # 方法二:该方法是按序读取,可以结合shuf先随机打乱,再按顺序读取 # sed -n '开始行数,结束行数p' 待截取文件 >> 保存的新文件 $ sed -n '1,1000p' test.txt >> sample_1000.txt
$ more ts1.txt //查看文件ts1 $ more ts2.txt //查看文件ts2 $ cat ts1.txt ts2.txt // 按行合并 $ paste tst.txt ts2.txt //按列合并 # 保存合并后的结果 $ cat ts1 ts2 > new_row.txt $ paste ts1 ts2 > new_col.txt
4、od命令,查看特殊格式的文件。
#tr 用于转换文本文件终端字符 cat tr.txt | tr [a-z] [A-Z]
5、wc 命令
6、find命令