
linux
文章平均质量分 55
mx_windforce
这个作者很懒,什么都没留下…
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
awk中调用系统命令批量处理
工作中经常遇到在输入一堆文件名的条件下,将其移动或者删除或者复制。由于输入是个文件名的集合,而不是单个文件,因此不能直接用cp或者mv命令,可以通过awk的逐行处理的功能来处理这种情况。以下是一个例子:$ grep -r 'TE' * | cut -d " " -f3 | awk '{system("mv "$1" ./English_mlfs/")}'1. grep,在当前文件夹内的原创 2016-01-27 17:56:12 · 2168 阅读 · 0 评论 -
如何在linux shell中输入制表符tab
按住ctrl再按v再按i原创 2017-06-16 23:51:56 · 16395 阅读 · 3 评论 -
使用sed过滤提取文本中的信息
sed -r -n -e '/ERROR/p' mntenu_check.log | sed -r -e '/\[.{8}\.mlf\]/!d' | sed -r -e 's/.*\[(.{8})\.mlf\].*/\1/g' | uniq > filenamesTobeRemoved.log1. 第一步,在文件中将含有"ERROR"字符串的行输出。-n 与p的配合使用2. 第二步原创 2016-05-17 14:23:51 · 1944 阅读 · 0 评论 -
使用tar和gzip对某文件夹内的某类型文件进行压缩与解压缩
有时候,需要对某个文件夹内的某个类型的文件进行压缩。由于使用tar压缩时会把绝对路径也压缩进去,这时解压缩则会多出这些文件夹结构,很麻烦,那么使用如下命令:tar -C /dir1/dir2 -czvf /dir3/dir4/my.tar.gz *.ext1解释如下:1. -C 表示要压缩的文件在/dir1/dir2内,这样压缩后,只有ext1类型的文件,而没有/d原创 2016-05-11 17:53:41 · 6163 阅读 · 0 评论 -
awk循环处理文本进行统计
由于awk对于标准格式文本可以快速分割,因此我有时候懒得用python再去写更长的脚本去做一些简单的统计和打印工作。比如,现有文本为对一些符号的分类:pre_groups:CH_DTL = z c s ìpre_groups:CH_RTR = Z C S r î用集合的语言来说,我希望,该分类满足:1. 完备性:所有的元素必须属于某一个分类。2. 唯一性:所有的元素仅能原创 2016-02-26 11:34:27 · 3939 阅读 · 0 评论 -
linux下用grep查找文件夹内含有某字符串的文件
有时候,需要查看哪些文件含有指定的字符串,然后拷贝或者删除。可以使用grep或者egrep来实现。比如,查找含有\TE\的文件名,只列出文件名grep -rnl "\\\\TE\\\\" **表示当前目录的所有文件和子文件夹。所以,可以替换为某个文件夹名或者指定的文件名-r 表示递归查找-n 表示删除行号-l 表示只输出文件名-L 表示只输出不含有该字符串的文件名原创 2016-03-02 16:08:09 · 2865 阅读 · 0 评论 -
使用find在目录中查找文件的常用用法
有时候要找几年前存在电脑里的文件,不但位置忘记了,就连文件名都忘记的差不多了,怎么办?可以使用linux或者cygwin下的find命令,只要对文件名还有一些印象,就可以。1. 使用正则表达式。正则表达式实在是字符串匹配最好用的东东了,无论是用grep和sed在文件中查找符合条件的行,还是使用find来查找符合条件的文件名,都要用到正则表达式,灵活!怎么使用呢,很简单,使用选项-reg原创 2016-01-14 15:02:01 · 1714 阅读 · 0 评论 -
如何在grep和sed命令中使用扩展的正则表达式
对于grep,可以使用egrep命令来替代,那么就支持扩展的正则表达式了。对于sed,只要加上参数-r就可以支持扩展的正则表达式了。由于平时写python用的正则表达式大部分都是扩展的正则表达式,所以,出于习惯,我喜欢更自由的扩展的正则表达式,使用起来不用去考虑是否支持的问题。以下是使用的例子,假设有一堆文件,内容都是诸如:snme0001 今天心情不错!stta000原创 2016-01-13 15:24:09 · 3461 阅读 · 0 评论 -
linux下递归修改子目录内的文件名
有时候,需要修改某个文件夹内的所有某个扩展名的文件的文件名,比如大小写互转。那么我们就需要获取所有的相关文件名,然后进行重命名。获取相关文件名的绝对路径名可以用find命令,而修改文件名则使用mv命令,至于循环的处理,则只能使用awk这种程序语言来进行处理。例子:当前文件夹下,所有以.PCM为扩展名的文件都是大写,我们要把它们都转为小写。命令为:$ find $PWD -regex .*P原创 2016-01-29 14:20:15 · 7206 阅读 · 0 评论 -
遍历文件夹内所有文本文件,查找含有某种模式的行,合并到一个文件
例子:当前文件夹下有一堆文本文件,其内容的格式都是如下:snme0001 我心情很好啊!句子ID和文本之间是tab。我想把文本不含英文的行都抽取出来放到一个新的文件中,比如"abc.txt“。grep -r '[[:alpha:]]\{4\}[[:digit:]]\{4\}' * | cut -d ":" -f2 | grep -v '[[:alpha:]]\{4\}[[:原创 2016-01-11 14:59:03 · 1470 阅读 · 0 评论 -
使用kaldi进行语音自动切分、模型训练和强制对齐
这里,主要介绍一下网上的教程,经过一步步实验,对某些可能让人容易误解的地方进行注释。1. 只有原始录音和音素标注,进行初次以及多轮的单音素、三音素模型训练,并且基于这些模型进行语音切分:http://pages.jh.edu/~echodro1/tutorial/kaldi/kaldi-training.html手工实验下来,只有两个地方略微不同。1. 网上谈到要在lexico原创 2017-06-17 23:57:19 · 14753 阅读 · 2 评论