引言
最近需要做一个php网页汉化的任务,找到了一个老版本的汉化版,老版本的汉化所有的包含中文的php也没的编码格式都是UTF-8,为了不一个一个的去找老版本的包含中文的php页面,想要写一个shell 脚本筛选出所有包含中文呢的php文件。
实现
脚本的任务很简单,写起来也很简单:递归遍历目录下的所有文件,查看文件格式,如果是UTF-8则筛选出来,不是UTF-8则过滤掉。代码如下所示
#/bin/bash
utf8_re="*UTF-8*"
path=./
for File in `find $path`
do
filetype=`file $File`
echo $filetype|grep -E $utf8_re>/dev/null 2>&1
if [ $? -eq 0 ];then
echo $filetype
fi
done
下面分析一下。
首先定义了两个变量,一个用来进行匹配文件编码格式,一个用来指