使用enca进行编码转换

问题:

文件编码转换:国标GB-2312转国际通用字库utf-8

方法:

利用enca工具进行编码转换,linux系统下使用如下命令进行安装:

sudo apt-get install enca

enca工具的使用命令如下:

# 查看filename文件的编码
enca -L zh_CN filename
# or enca filename
# 将filename文件编码转为utf-8
enca -L zh_CN -x UTF-8 filename
# or -x UTF-8 filename
# 另存更改编码后的文件为filename2
enca -L zh_CN -x UTF-8 filename filename2
# or -x UTF-8 filename filename2

使用bash脚本批量转换文件的编码:

cli="find . -type f \( "
for arg in ${@:1:$#-1}
do
	cli="$cli -iname \*.$arg -o "
done
cli="$cli -iname \*.${@: -1} \)"

PRE_IFS=$IFS
IFS=$'\n'
for i in `eval $cli`
do
	enca -x utf-8 $i # 对文件进行编码转换
done
IFS=$PRE_IFS
echo "ok!"

使用示例:

# 对当前目录及子目录中符合要求的文件进行编码转换
# 对.csv文件进行编码转换
bash ./GB-2312toUTF-8.sh csv

 

上一篇:查找DSYM文件


下一篇:C++ 文件操作