解决php使用ZipArchive解压时中文乱码问题

使用php自带的ZipArchive来解压带中文文件名压缩包时会造成乱码,现象如下:

原结构:

 解决php使用ZipArchive解压时中文乱码问题

解压代码:

$zip = new \ZipArchive();
$res = $zip->open(‘./钱学森班.zip‘);
if ($res !== true){
    throw new \Exception(‘打开压缩包失败‘);
}
$zip->extractTo(‘./cache‘);
$zip->close();

 解压后:

 解决php使用ZipArchive解压时中文乱码问题

原因

默认windows,mac打压缩包时编码为简体中文,解压时未作文件转化导致解压结果与预期不符

解决方法

打开压缩包后先将内部文件名及目录进行转码,转码后需关闭压缩包并重新打开解压

实现如下:

$zipName = ‘./钱学森班.zip‘;
$zip = new \ZipArchive();
$res = $zip->open($zipName);
if ($res !== true){
    throw new \Exception(‘打开压缩包失败‘);
}

// 加入此段↓
$fileNum = $zip->numFiles;
for ($i = 0; $i < $fileNum; $i++) {
    $statInfo = $zip->statIndex($i, ZipArchive::FL_ENC_RAW);
    $zip->renameIndex($i, iconv(‘GBK‘, ‘utf-8//IGNORE‘, $statInfo[‘name‘]));
}
$zip->close();
$zip->open($zipName);
// 截至↑

$zip->extractTo($extractTo);
$zip->close();

 

注意事项

  • 转码后因为修改了原压缩包文件,所以不可重复转码,若不想对原文件产生影响需先复制(php-zip扩展是自己读文件流,不需要复制)
  • 转换前使用mb_detect_encoding进行编码判断依然是返回UTF-8

解决php使用ZipArchive解压时中文乱码问题

上一篇:一个Netflix开发的微服务编排引擎,支持可视化工作流定义


下一篇:BZOJ 1787: [Ahoi2008]Meet 紧急集合 LCA