问题:
文件编码转换:国标GB-2312转国际通用字库utf-8
方法:
利用enca工具进行编码转换,linux系统下使用如下命令进行安装:
sudo apt-get install enca
enca工具的使用命令如下:
# 查看filename文件的编码
enca -L zh_CN filename
# or enca filename
# 将filename文件编码转为utf-8
enca -L zh_CN -x UTF-8 filename
# or -x UTF-8 filename
# 另存更改编码后的文件为filename2
enca -L zh_CN -x UTF-8 filename filename2
# or -x UTF-8 filename filename2
使用bash脚本批量转换文件的编码:
cli="find . -type f \( "
for arg in ${@:1:$#-1}
do
cli="$cli -iname \*.$arg -o "
done
cli="$cli -iname \*.${@: -1} \)"
PRE_IFS=$IFS
IFS=$'\n'
for i in `eval $cli`
do
enca -x utf-8 $i # 对文件进行编码转换
done
IFS=$PRE_IFS
echo "ok!"
使用示例:
# 对当前目录及子目录中符合要求的文件进行编码转换
# 对.csv文件进行编码转换
bash ./GB-2312toUTF-8.sh csv