之前开放了一个空间,给网友提供电台节目音频下载。由于多年节目的文件数量甚多,且分类没有特定格式,图省事,没有制作网页提供分类下载,而是直接利用Apache的目录浏览功能,简单直观。
不过,所在的美国服务器默认Apache编码设置为ISO-8859-1,使得中文文件名出现乱码,每次浏览只能手动设置一下浏览器的编码,设置为GB2312就可以正常显示了。每刷新一次都要设置一次,好是麻烦。想解决这个问题,但是找了好多资料,都没有解决到。一直就拖了将近2年了。辛苦了需要下载的网友了。
这几天,突然有冲动,要把这个问题解决。
首先是给DH的customer service反应了(其实以前也反应过此问题),我在提问的同时,给了一个可能的解决方案给DH,让他们协助修改http.conf,将"AddDefaultCharset ISO-8859-1"修改为"AddDefaultCharset GB2312"。迅速得到DH的回复,可惜答案并没有解决我的问题。DH不允许修改系统配置,告诉我去修改htaccess文件,看看能否解决问题。又见htaccess文件……我修改了几十次的配置文件,不过没有一次可以成功解决这个乱码问题。虽然如此,见DH热心地附上了配置参考文档(http://www.w3.org/International/questions/qa-htaccess-charset),还是挺感激的。
之前,利用htaccess,企图解决乱码问题,尝试过以下多种指令:
AddDefaultCharset GB2312
DefaultLanguage zh-cn
AddDefaultCharset none
AddDefaultCharset Off
AddLanguage zh-cn .cn
AddCharset gb2312 .html
AddCharset gb2312 .htm
用W3的检查器检查(http://validator.w3.org/detailed.html),结果发现,对Apache的目录浏览是不起作用的。只对上传的文件(.html等等)起作用。
经过分析,应该是由于默认的目录浏览方式是由Apache生成index文件的,因为只能在生成前设定编码。
再仔细看了一下htaccess文件配置文档,发现Apache Module mod_autoindex(http://httpd.apache.org/docs/2.2/mod/mod_autoindex.html#indexoptions),里面有FancyIndexing项目(其实之前都用过这个设置的IndexOptions NameWidth了),IndexOptions竟然也有一个关于编码的设置,Charset=character-set,天啊!怎么之前没有看到?!一看到这个选项,就感觉已经接近解决乱码问题了。
立刻修改htaccess文件,加入
IndexOptions Charset=GB2312
重新打开网页,成功!用W3的检查器检查,也是显示编码为GB2312!终于解决了!