JSP学习（一）之中文乱码问题的解决

2022-10-26 13:19:53

一、响应中的乱码

我们所看到的页面，是由服务器把内容放入响应（response）中，然后发送给浏览器的。如果响应中的数据无法被正常解析，就会出现中文乱码。为什么英文不存在乱码问题？因为无论是ISO-8859-1/gb2312/utf-8，它们对于英文的编码方式都是一样的，即一个字符为8位。而中文就比较混乱，在gb2312下一个中文占16位，而在utf-8下占24位。浏览器在不知道编码方式时，就会把这些字符从中间截断，在显示的时候自然就乱码了。因此想要解决乱码问题，就要告诉浏览器我们采用了什么样的编码方式。这需要以下几步：

1.因为服务器首先要从jsp中读取数据，经过处理后写入相应，因此首先要确定jsp文件的编码格式。windowXP系统默认的编码格式是gb2312。

2.在http响应（response）中声明编码方式，方法为：<%@ page contentType="text/html; charset=gb2312"%>
该内容要放在jsp页面的第一行，这样浏览器就知道响应的编码格式了。

3.还要在html中指定编码格式：

<head>
<meta http-equiv="Content-Type" content="text/html; charset=gb2312" />
<title>title</title>
</head>

meta部分指定了当前html的编码格式。注意这一段要放在head的最前面，否则在IE下可能会有问题。

二、请求中的乱码

1.Post乱码

当使用Post提交并使用ISO8859-1编码时，如果使用默认方式从请求获取数据，则中文一定会出现乱码。为了解决这个问题，我们需要在响应的JSP中添加：

request.setCharacterEncoding("gb2312");

可见，Post的乱码问题很好解决。这是因为通过Post方式提交的数据均以二进制的形式附加在http请求的body部分发送，因此只需要在后台指定编码格式即可。

2.GET乱码

点击超链接时，默认的提交方式为Get。这种方式会直接将参数附加到URL后面进行提交，无法使用以上方法进行处理。那这也没有什么特别方便的方法，只能对参数重新进行编码，示例如下：

<%
    String username = request.getParameter("username");
    byte[] bytes = username.getBytes("iso-8859-1");
    String result = new String(bytes, "gb2312");
    out.print(result);
%>

简写的话如下所示：

<%=new String(new String(request.getParameter("username").getBytes("iso-8859-1"), "gb2312")%>

可见，这种提交方式的缺点是所有的中文都需要转码，比较麻烦。因此最好不要将中文参数写入超链接，form尽量使用Post来提交。

码农公寓

相关文章