原来写的js文件,从来没有关心过他们的编码问题。可是后来不知怎么的,发现一些单独都好使得文件,被同时引用到一个页面中时,就错误不断,根本不能执行。Debug半天,原来是文件编码问题搞得鬼。
一般我们在中文OS中保存文本文件,默认都是一GB2312编码保存的,比如VS.NET 2003,2005都是这样。可是当我们在脚本代码中写有"©"这些符号后,保存文件会提示让你保存为Unicode格式。如果你不加理会,仍然保存为GB2312,那么下次打开这个文件你会发现"©"变成"?"@_@。这样的字符还有一些,比如在Windows中的高位ASCII字符,它们的Unicode定义就是一些比较怪异的字符,如果用GB2312强行存这些字符,打开后会被两两合并为汉字或成为乱码。
回到我们脚本文件编码的问题上来,如果我们在同一个页面中引用多个JavaScript文件,而这些文件的保存编码又不同(有GB2312有又Unicode),就可能出错。当然不是总都出,这也是最要命的。由于对于7bit ASCII码,不管什么编码都是通用的,也不会有解码问题,可是如果文件里包含了汉字,就有可能出错了。
比如,GB2312保存的js文件:
var str = '这是一个GB2312编码文件。';
var description = 'this file saved as GB2312 encoding.';
var description = 'this file saved as GB2312 encoding.';
Unicode编码保存的js文件:
var strW = '这是一个Unicode编码文件。';
var descriptionW = 'this file saved as Unicode encoding.';
var descriptionW = 'this file saved as Unicode encoding.';
而这两个文件在下列引用中,不管怎么选择IE编码也是不能正确执行结果:(
<html>
<head>
<title>Test Encode</title>
<script src="Unicode.js" language="javascript"></script>
<script src="GB2312.js" language="javascript"></script>
</head>
<body>
<script language="javascript">
alert(strW + '\r\n' + descriptionW);
alert(str + '\r\n' + description);
</script>
</body>
</html>
<head>
<title>Test Encode</title>
<script src="Unicode.js" language="javascript"></script>
<script src="GB2312.js" language="javascript"></script>
</head>
<body>
<script language="javascript">
alert(strW + '\r\n' + descriptionW);
alert(str + '\r\n' + description);
</script>
</body>
</html>
不过如果js中只有低位ASCII字符,不同编码的文件引用到一个页面不会有问题。
本文转自博客园鸟食轩的博客,原文链接:http://www.cnblogs.com/birdshome/,如需转载请自行联系原博主。