
文本处理
xuejinliang
这个作者很懒,什么都没留下…
展开
-
tac处理文本
file,如何去除从a到c之间的数据12abcdce结果abcdc方法一:sed -n '/a/,$p' file | tac | sed -n '/c/,$p' | tac这个方法我觉得挺巧妙的首先取出的是a开头的行,然后在翻转(tac),然后在取出c开头的行,这时候就取出了从c到a的所有的行,然后在翻转即得到了结果。t原创 2016-10-17 14:59:08 · 590 阅读 · 0 评论 -
awk fieldwidths
AWK中的FIELDWIDTHS是一个很好用的变量,这个变量可以指定字符串按照怎么样的宽度进行展示要求:032130032131146230035048222049095070095261155052142050替换成为IP地址:32.13032.131146.23035.48222.4995.70155.52142.50原创 2016-11-24 17:43:50 · 1140 阅读 · 0 评论 -
字符串按照要求对字符个数进行处理
在截取一行中字符串,按照输出某几个的时候,AWK,xargs,grep都可以为实现,下面简单的说明下使用情况file11 hello world2 b31、要求每行只有两个字段,其余的字段如果多的话自动的转入到下一行中cat file1 | xargs –n22、要求处理文本,每一行只有两个字符grep –oP .{2} file1注意,如果此行中没有到两个字原创 2016-12-06 11:44:22 · 422 阅读 · 0 评论 -
每行指定元素个数进行输出
在处理文本的过程中,会遇到如下的问题file11234567894或者是file21 2 34 6 7 u 74 6 要求每行有三个元素,如果本行有多余的元素直接接到下一行在file2中要求每行只有一个元素awk -vOFS='\n''$1=$1' file2这个是awk的解决方法,直接将字段的分隔符换位了回车。c原创 2016-12-02 10:28:35 · 784 阅读 · 0 评论 -
shuf处理文本
在CU上面看到了一个帖子,帖子的内容即要求是:请教一下,我需要频繁不断地联接9台服务器执行某个相同的服务。但我有特殊的要求:1。 每次都按不同的顺序来访问这9台服务器。例如:135987642,下次又是乱序依次访问。 2。 希望这9台服务器的主机名通过一个shell 脚本集成不需要另外起一个txt文档来读取。看到随机数字我首先想到的是random,但是这个题目中其实会有更好的办法原创 2016-12-10 22:47:10 · 823 阅读 · 0 评论 -
小说 sed
看cu大神的sed帖子总结博客,如下,请大神们批评指教。sed叫做流编辑器,也就是必须要有输入流,才能对文本进行编辑。示例文本如下:cat file1 1a aa,a a,a11=1c 11=1c11c 11aaa aaad1.s 1.sa1、在每行的下面插入一个空行:sed ‘G’ file2、在每行的上面插入一个空行:se原创 2016-11-02 15:39:55 · 415 阅读 · 0 评论 -
shell进程替换 find使用通配符,xargs -n1参数讲解
文本处理:将/etc/passwd文件中的用户名和用户使用的shell打印出来,中间用冒号来连接,这个需求的话利用AWK可以轻易的实现,下面利用进程替换来实现。paste –d: 这个步骤可以省去中间的临时文件。xargs –n1 参数可以实现将前面的结果每次传入一个参数。find ./ -name \*.tar.gz 这样可以找到以.tar.gz结尾的文件。note原创 2016-11-16 18:34:02 · 3857 阅读 · 0 评论 -
find-links 第二发参数解释
find–links第二发:在使用find的过程中,links后面可以跟上一个参数,并且这个参数存在三种情况:find./ -type d –linksn --à代表查找当前目录下面的文件只有n那个连接,(hard-links)-n --à代表查找当前目录下面的文件少于n那个连接,(hard-links)+n --à代表查找当前目录下面的文件多于n那个连接,(hard-原创 2016-11-11 11:46:30 · 1119 阅读 · 0 评论 -
find -links 参数
在CU上面看到一个帖子,楼主的要求是查找当前目录下面的文件夹目录,并且实现在最后一级目录下面实现建立文件夹的需求:目录如下:mydir/srcmydir/src/mainmydir/binmydir/bin/classes想要获取的目录如下:mydir/src/mainmydir/bin/classes这个需求可以利用 find命令来实现:find ./原创 2016-11-11 11:18:37 · 926 阅读 · 0 评论 -
awk 使用表示次数的正则表达式(--posix --re-interval)
在AWK处理一个文本的时候,想指定比如说三个横线为分隔符,结果利用-F以及正则表达式的时候发现指定的三个横线不管用。而后发现了—posix参数。POSIX字符集:[:alnum:] 文字数字字符[:alpha:] 文字字符[:digit:] 数字字符[:graph:] 非空字符(非空格、控制字符)[:lower:] 小写字符[:cntrl:] 控制字符[原创 2016-11-26 13:19:22 · 2114 阅读 · 0 评论