android 中国通信乱码问题

1.要解决中文乱码问题。首先得了解什么是字符编码

计算机要处理各种字符,就须要将字符和二进制内码相应起来,这样的相应关系就是字符编码。

要制定字符编码首先要确定字符集,并将

字符集内的字符排序。然后和二进制数字相应起来。依据字符集内字符的多少。确定几个字节来编码。

2.经常使用的字符编码

ASCII 编码是眼下计算机中经常使用的最广泛地 字符集及其编码。

ISO-8859-1能够表示的是西欧语言。看起来非常单一,可是因为是单字节编码,与计算机最基础的表示单位一致,所以在非常多时候。仍旧使用ISO-8859-1编码来表示,并且在非常多协议上默认使用这样的编码。

Unicode编码(统一码),通常所说的UTF-8就是Unicode编码的实现方式。

GB2312字集是简体字集。BIG5字集是*繁体字集;GBK字集是简繁字集;GB18030
是国家制定的一个强制性大字集标准;Linux系统默认的使用的是ISO-8859-1编码,。如今的PC平台必须支持GB18030。对嵌入式产品暂不作要求。所以手机、MP3一般仅仅支持GB2312。

3.网络传输产生中文乱码原因

网络通信中,产生乱码的原因主要是通信过程中使用了不同的编码方式:server中的编码方式,传输过程中的编码方式,传输到达终端设备的编码方式。

因此在传输过程中就须要至少两次编码转换:首先从server编码转为网络编码,再从网络编码转为终端设备编码。在转换的过程中出现不论什么情况都可能出现编码混乱。

4.处理中文乱码问题经常使用两种方式解决

(1)因为大部分终端设备都支持Unicode字符集。所以在连接网页时。我们希望网页数据在网络传输时使用UTF-8方式传输,我们就能够将UTF-8转化为Unicode字符集。以下我们将通信过程中得到的流转化为字节。然后再将字节按GB2312 的方式进行转换得到字符串。

InputStream is = conn.getInputStream();

BufferedInputStream bis = new BufferedInputStream(is);

byte bytearray[] = new byte[1024];

int current= -1;

int i=0;

while((current=bis.read())!=-1) {

bytearray[i] =(byte) current;

i++;

}

resultData = new String (bytearray,"GB2312");//网络中以字节想形式默觉得UTF-8进行编码,以GB2312显示到终端

通过上面的转换,“resultData”字符串便能够显示中文效果了。

(2)还有一种方式是书记在传递的过程中使用ISO-8859-1字符集,这样就是直接使用了ASCII编码方式,当然在传递到终端设备时。须要将其数据反转才可以正常的显示。

以下我们将一个字符串按ISO-8859-1字符集进行转换为gbk,代码例如以下:

public static String formatStr(String str){

if(str==null || str.length()==0){

return "";

}

try{

return new String (str.getBytes("ISO-8859-1"),"gbk"); //先在网络中以ISO-8859-1进行编码。再以gbk输出到终端

}

}

总结:归根结底,解决中文乱码仅仅须要两个步骤:

·使用getBytes("编码方式");来对汉字进行重编码。得到它的字节数组。

·再使用new String (Bytes[],"解码");解码相应的字节数组。

版权声明:本文博客原创文章,博客,未经同意,不得转载。

上一篇:RabbitMQ 记录


下一篇:Python使用一个进度条