利用OpenCC进行批量文件繁简转换

以下操作步骤在CentOS6和7.8系统环境下测试通过,其他环境请自行解决。

1)安装编译工具

yum install cmake
yum install git

2)下载OpenCC源代码

git clone https://github.com/BYVoid/OpenCC

3)编译安装

cd OpenCC
make
make install

如果出现以下错误:

Could NOT find Doxygen (missing: DOXYGEN_EXECUTABLE)

先安装doxygen

yum search doxygen
yum install doxygen

4)安装成功后,运行

opencc --version

如果出现以下错误,需要先做一个库文件的软链接
 

opencc: error while loading shared libraries: libopencc.so.1.1: cannot open shared object file: No such file or directory

查看opencc运行时依赖哪些文件

[root@ywops OpenCC]# which opencc
/usr/bin/opencc

[root@ywops OpenCC]# ldd /usr/bin/opencc
	linux-vdso.so.1 =>  (0x00007ffd22bc1000)
	libopencc.so.1.1 => not found  #这里显示没有找到该文件
	libstdc++.so.6 => /lib64/libstdc++.so.6 (0x00007feffd6f6000)
	libm.so.6 => /lib64/libm.so.6 (0x00007feffd3f4000)
	libgcc_s.so.1 => /lib64/libgcc_s.so.1 (0x00007feffd1de000)
	libpthread.so.0 => /lib64/libpthread.so.0 (0x00007feffcfc2000)
	libc.so.6 => /lib64/libc.so.6 (0x00007feffcbf4000)
	/lib64/ld-linux-x86-64.so.2 (0x00007feffd9fd000)

解决方法:建立库文件软链接

ln -s /usr/lib/libopencc.so.1.1 /usr/lib64/libopencc.so.1.1

再运行

opencc --version
#显示以下结果,代表安装成功
#Open Chinese Convert (OpenCC) Command Line Tool
#Version: 1.1.1

5)测试繁简转换

echo '美國國家海洋和大氣管理局' | opencc -c t2s
#t2s表示繁转简,具体参考https://github.com/BYVoid/OpenCC

6)批量文件繁简转化脚本

#!/usr/bin/sh
#filename: t2s_batch.sh
# 符合后缀的文件才处理
if [ $# -ne 2 ];then
    echo "USAGE: $0 path_name file_suffix"
    exit
else
	lst=`find $1 -type f -name "*.$2"`
        lst_num=`find $1 -type f -name "*.$2"|wc -l`

        if [ $lst_num -eq 0 ];then
                echo "no such files."
        else
		for file in $lst
		do
		    echo $file
		    opencc -i $file -o $file -c t2s
		done
        fi
fi

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值