貌似一个简单的问题(也许还真是简单的)但是却把曾经自认为弄清楚的我弄得莫名其妙
char在Java中应该是16个字节
byte在Java中应该是8个字节
char x = '编'; //这样是合法的,输出也是16个字节
但是
String str = "编";
byte[] bytes = str.getBytes(); //我想不明白,为什么这里要占用3个byte呢?
3个byte一共是3*8=24个字节,那么char x怎么又放得下?我坚信char是16个字节,
但是str.getBytes()这个东西到底又怎么回事?
不好意思,表达有点乱,但是的确太奇怪了。希望大家能指点一下。
1楼:
首先,java中的一个char的确是2个字节。java采用unicode,2个字节来表示一个字符。
其次,楼主你说的byte[] bytes = str.getBytes();之后是3个字节,这里和前面的概念不一样。java是用unicode来表示字符,"编"这个中文字符的unicode就是2个字节。String.getBytes(encoding)方法是获取指定编码的byte数组表示,通常gbk/gb2312是2个字节,utf-8是3个字节。如果不指定encoding则取系统默认的encoding.
另外,楼主的“字节”说的有点乱,通常我们说的字节是指byte,还有一个"位"的概念(bit),通常情况下1 byte=8 bit.
"3个byte一共是3*8=24个字节"这句话应该表示为“3个byte一共是3*8=24个bit”