数据类型
数据类型有什么用?数据类型用来声明变量,程序在运行过程中根据不同的数据类型分配不同大小的空间。在Java中数据也是有类型的(任何数据必然会有类型),Java中数据的分类如下图所示:
基本数据类型:Java语言中内置的类型,分别是整数类型、小数类型、字符类型、布尔类型。这四类基本类型是最简单、最基础的类型。基本数据类型内存占用和取值范围如下图所示:
引用数据类型:它是基于基本数据类型创建的。JavaSE中提供了一个超级类库,类库中包含了近万种引用数据类型。
计算机存储单元
计算机在任何情况下都只能识别二进制。计算机是可以用来存储数据的,但是无论是内存还是硬盘,计算机存储设备的最小信息单元叫“位(bit)”,我们又称之为“比特位”,通常用小写的字母”b”表示,也就是一个0或者1。而计算机中最基本的存储单元叫“字节(byte)”,通常用大写字母”B”表示,字节是由连续的8个位组成。除了字节外还有一些常用的存储单位,其换算单位如下:- 1B(字节) = 8bit
- 1KB = 1024B
- 1MB = 1024KB
- 1GB = 1024MB
- 1TB = 1024GB
例如:
byte b = 2; // 在计算机底层中是这样表示的:00000010 short s = 2; // 在计算机底层中是这样表示的:00000000 00000010 int i = 2; // 在计算机底层中是这样表示的:00000000 00000000 00000000 00000010
不同进制之间可以通过一定的规则相互转换。不过现在我们先要学习的是基本类型!下面我们来详细说下基本数据类型:
整数类型:byte、short、int、long
- Java各整数类型有固定的表数范围和字段长度,不受具体OS的影响,以保证java程序的可移植性。
- 整数型:byte short int long有什么区别?区别:占用的空间大小不同。
- 在java中有一条非常重要的结论,必须记住: 在任何情况下,整数型的“字面量/数据”默认被当做int类型处理。如果希望该“整数型字面量”被当做long类型来处理,需要在“字面量”后面添加L/l 建议使用大写L,因为小写l和1傻傻分不清。
- bit: 计算机中的最小存储单位。byte:计算机中基本存储单元。
代码举例
/* 整数型在java语言*4种类型: byte 1个字节 最大值127 short 2个字节 最大值32767 int 4个字节 2147483647是int最大值,超了这个范围可以使用long类型。 long 8个字节 1个字节 = 8个二进制位 1byte = 8bit 对于以上的四个类型来说,最常用的是int。直接使用int类型就好。 在java语言中整数型字面量有4种表示形式: 十进制:最常用的。 二进制 八进制 十六进制 */ public class Demo04Int { public static void main(String[] args){ // 十进制 int a = 10; System.out.println(a); // 10 // 八进制 int b = 010; System.out.println(b); // 8 // 十六进制 int c = 0x10; System.out.println(c); // 16 int x = 16; //十进制方式 System.out.println(x); // 二进制(JDK8的新特性,低版本不支持。) int d = 0b10; System.out.println(d); // 2 } }
布尔类型:boolean
- boolean 类型用来判断逻辑条件,一般用于程序流程控制:
- boolean类型数据只允许取值true和false,无null。
- 不可以使用0或非 0 的整数替代false和true,这点和C语言不同。
- Java虚拟机中没有任何供boolean值专用的字节码指令,Java语言表达所操作的 boolean值,在编译之后都使用java虚拟机中的int数据类型来代替:true用1表示,false 用0表示。
代码举例:
/* 1、在java语言中boolean类型只有两个值,没有其他值: true和false。 不像C或者C++,C语言中1和0也可以表示布尔类型。 2、boolean类型在实际开发中使用在哪里呢? 使用在逻辑判断当中,通常放到条件的位置上(充当条件) */ public class Demo12Boolean { public static void main(String[] args){ //boolean sex = 1; 错误: 不兼容的类型: int无法转换为boolean // 需求规定:如果为true则表示男,为false则表示女。 boolean sex = false; // if语句是一个条件语句 // 例如:如果这个布尔型值是true,则表示男性,为false则表示女性。 if(sex){ System.out.println("男"); }else{ System.out.println("女");//女 } } }
字符编码的由来
- 对于8种基本数据类型来说:其中byte,short,int,long,float,double,boolean,这7种类型计算机表示起来比较容易,因为他们都是数字。其中布尔类型只有两个值true和false,实际上true和false分别在C++中对应的是1和0,1为true,false为0。
- 对于char类型来说:计算机表示起来比较麻烦,因为char对应的是文字,每一个国家的文字不一样,文字不能直接通过“自然算法”转换成二进制。这个时候怎么办?字符编码诞生了。
什么是字符编码?
- 字符编码是人为的定义的一套转换表。 在字符编码中规定了一系列的文字对应的二进制。字符编码其实本质上就是一本字典,该字段中描述了文字与二进制之间的对照关系。字符编码是人为规定的。
- 字符编码涉及到编码和解码两个过程,编码和解码的时候必须采用同一套字符编码方式,不然就会出现乱码。
关于字符编码的发展过程?
- 在计算机内部,所有数据都使用二进制表示。每一个二进制位(bit)有 0 和 1 两种状态, 因此 8 个二进制位就可以组出 256 种状态,这被称为一个字节(byte)。一个字节一 共可以用来表示 256 种不同的状态,每一个状态对应一个符号,就是 256 个符号,从 0000000 到 11111111。
ASCII码:
上个世纪60年代,美国制定了一套字符编码,对英语字符与二进制位之间的 关系,做了统一规定。这被称为ASCII码。ASCII码一共规定了128个字符的编码,比如 空格“SPACE”是32(二进制00100000),大写的字母A是65(二进制01000001)。这 128个符号(包括32个不能打印出来的控制符号),只占用了一个字节的后面7位,最前面的1位统一规定为0。
缺点:
- 不能表示所有字符。
- 相同的编码表示的字符不一样:比如,130在法语编码中代表了é,在希伯来语编码中却代表 (ג) 了字母Gimel
Unicode 编码
乱码:世界上存在着多种编码方式,同一个二进制数字可以被解释成不同的符号。因 此,要想打开一个文本文件,就必须知道它的编码方式,否则用错误的编码方式解读, 就会出现乱码。 Unicode:一种编码,将世界上所有的符号都纳入其中。每一个符号都给予一个独一 无二的编码,使用 Unicode 没有乱码的问题。
Unicode 的缺点:
- Unicode 只规定了符号的二进制代码,却没有规定这个二进制代码 应该如何存储:无法区别 Unicode 和 ASCII:计算机无法区分三个字节表示一个符号 还是分别表示三个符号。
- 我们知道,英文字母只用一个字节表示就够了,如果 unicode统一规定,每个符号用三个或四个字节表示,那么每个英文字母前都必然有 二到三个字节是0,这对于存储空间来说是极大的浪费。
UTF-8
UTF-8 是在互联网上使用最广的一种 Unicode 的实现方式。 UTF-8 是一种变长的编码方式。它可以使用 1-6 个字节表示一个符号,根据不同的符号而变化字节长度。
UTF-8的编码规则:
- 对于单字节的UTF-8编码,该字节的最高位为0,其余7位用来对字符进行编码(等同于 ASCII码)。
- 对于多字节的UTF-8编码,如果编码包含 n 个字节,那么第一个字节的前 n 位为1,第一 个字节的第 n+1 位为0,该字节的剩余各位用来对字符进行编码。
- 在第一个字节之后的所有的字节,都是最高两位为"10",其余6位用来对字符进行编码。
浮点类型:float、double
与整数类型类似,Java 浮点类型也有固定的表数范围和字段长度,不受具体操作系统的影响。float和double存储数据的时候都是存储的近似值。浮点型:float和double有什么区别?区别:占用的空间大小不同。浮点型常量有两种表示形式:
- 十进制数形式:如:5.12 512.0f .512 (必须有小数点)
- 科学计数法形式:如:5.12e2 512E2 100E-2
float:单精度,尾数可以精确到7位有效数字。很多情况下,精度很难满足需求。
double:双精度,精度是float的两倍。通常采用此类型。
- Java 的浮点型常量默认为double型,声明float型常量,须后加‘f’或‘F’。
- 注意:任意一个浮点型都比整数型空间大。
代码举例:
public class Demo11Float{ public static void main(String[] args){ // 任何一个浮点型数据默认被当做double来处理 pi是double类型 double pi = 3.1415926; System.out.println(pi);//3.1415926 // 这个可以吗? //float f = 3.14;错误: 不兼容的类型: 从double转换到float可能会有损失 // 怎么修改以上的代码呢? // 第一种方式:在字面量后面添加F/f //float f = 3.14f; //float f = 3.14F; // 第二种方式:强制类型转换,但可能损失精度。谨慎使用。 float f = (float)3.14; System.out.println(f);//3.14 // 分析这个程序,可以编译通过吗? // int i = 10.0 / 5;错误: 不兼容的类型: 从double转换到int可能会有损失 // 原理:先将5转换成double类型,然后再做运算,结果是double // 大容量无法直接赋值给小容量,需要强转。 // 修改方式 1 int i = (int)10.0 / 5; System.out.println(i); // 2 // 修改方式2 int x = (int)(10.0 / 5); System.out.println(x); // 2 } }
字符类型:char
- char 型数据用来表示通常意义上“字符”(2字节)
- 字符型一定是单个字符才能成为“字符型”
- Java中的所有字符都使用Unicode编码,故一个字符可以存储一个字母,一个汉字,或其他书面语的一个字符。
- char 类型和 short 类型都是占用 2 个字节,所以它们可表示的种类数量是相同的,不过由于 char 类型表示文字,没有负数这一说,所以相对来说 char 类型可以取到更大的正整数。 通过上表我们也可以看出,short 类型取值范围[-32768~32767],而 char 类型取值范围是 [0~65535],它们可表示的种类数量都是 65536 种,只不过 char 可以取到最大值为 65535。
代码举例
/* 字符型: char 1、char占用2个字节。 2、char的取值范围:[0-65535] 3、char采用unicode编码方式。 4、char类型的字面量使用单引号括起来。 5、char可以存储一个汉字。 */ public class Demo01Char{ public static void main(String[] args){ // char可以存储1个汉字吗? // 可以的,汉字占用2个字节,java中的char类型占用2个字节,正好。 char c1 = '中'; System.out.println(c1); char c2 = 'a'; System.out.println(c2); // 0如果加上单引号的话,0就不是数字0了,就是字符0,它是1个字符。 char c3 = '0'; System.out.println(c3); // char c4 = "a";错误: 不兼容的类型: String无法转换为char // char c5 = 'ab'; 错误: 未结束的字符文字 // char c6 = '1.08'; 错误: 未结束的字符文字 } }
字符型变量的三种表现形式:
- 字符常量是用单引号(‘ ’)括起来的单个字符。例如:char c1 = 'a'; char c2 = '中'; char c3 = '9';
- Java中还允许使用转义字符‘\’来将其后的字符转变为特殊字符型常量。 例如:char c3 = ‘\n’; '\n'表示换行符
- 直接使用 Unicode 值来表示字符型常量:‘\uXXXX’。其中,XXXX代表 一个十六进制整数。如:\u000a 表示 \n。
char类型是可以进行运算的。因为它都对应有Unicode码。
转义字符
- 指用一些普通的字符组合代表一些特殊的字符,由于组合用的字符改变了原意,称为转义字符。Java 中的转义字符以 \ 开始,常见的转义字符有:\t、\n、\u、\\、\',\",其中\t 代表制表符,\n 是换行符,\\表示一个普通的\字符,\'表示一个普通的',\"表示一个普通的"。
代码举例
/* 关于java中的转义字符 java语言中“\”负责转义。就是改变后面的意思 \t 表示制表符tab */ public class Demo02Char{ public static void main(String[] args){ // 普通的't'字符 char c1 = 't'; System.out.println(c1);// t // 经过测试以下代码 \t 实际上是1个字符,不属于字符串 // 两个字符合在一起表示一个字符,其中 \t 表示“制表符tab” char c2 = '\t'; //相当于键盘上的tab键 // \的出现会将紧挨着的后面的字符进行转义。\碰到t表示tab键。 System.out.println("abc\tdef");// abc def /* System.out.println(); 换行 System.out.print(); 不换行 */ //char c3 = 'n'; // 普通的n字符 char c3 = '\n'; // 换行符 System.out.println(c3); // 假设现在想在控制台输出一个 ' 字符怎么办? // System.out.println('''); 错误: 空字符文字 // \' 表示一个普通不能再普通的单引号字符。(\'联合起来表示一个普通的 ') System.out.println('\'');//' // 假设现在想在控制台输出一个 \ 字符怎么办? //System.out.println('\');错误: 未结束的字符文字 // 在java中两个反斜杠代表了一个“普通的反斜杠字符” System.out.println('\\');// \ // 双引号括起来的是字符串 System.out.println("test"); //test // 希望输出的结果是:"test" // System.out.println(""test"");错误: 需要')' System.out.println("“test”"); //内部的双引号我用中文的行吗?可以。“test” System.out.println(""); // System.out.println(""");编译报错。 //System.out.println("\""); System.out.println("\"test\"");// "test" // 这个可以输出吗? // 这个不需要专门进行转义。 // 这个 ' 在这里只是一个普通的字符,不具备特殊含义。 System.out.println("'");//' //以下都有问题 //System.out.println('''); //System.out.println("""); // 可以的。 System.out.println("'这样呢'");//'这样呢' // 编译报错,因为:4e2d 是一个字符串 // char x = '4e2d';错误: 未结束的字符文字 // 反斜杠u表示后面的是一个字符的unicode编码。 // unicode编码是十六进制的。 char x = '\u4e2d'; System.out.println(x); // '中' } }
整数能否直接赋值给char?答案是可以的。当一个整数赋值给char类型变量的时候,会自动转换成char字符型,最终的结果是一个字符。转换标准,底层的字符编码。
基本数据类型转换
自动类型转换:把一个表示数据范围小的数值或者变量赋值给另一个表示数据范围大的变量。这种转换方式是自动的,直接书写即可。
- 有多种类型的数据混合运算时,系统首先自动将所有数据转换成容量最大的那种数据类型,然后再进行计算。
- byte,short,char之间不会相互转换,他们三者在计算时首先转换为int类型。
- boolean类型不能与其它数据类型运算。
- 当把任何基本数据类型的值和字符串(String)进行连接运算时(+),基本数据类型的值将自动转化为字符串(String)类型。
数据类型按容量大小排序为:
代码演示,自动类型转换
/* 在java中有一条非常重要的结论,必须记住: 在任何情况下,整数型的“字面量/数据”默认被当做int类型处理。(记住就行) 如果希望该“整数型字面量”被当做long类型来处理,需要在“字面量”后面添加L/l 建议使用大写L,因为小写l和1傻傻分不清。 当数据类型不一样时,将会发生数据类型转换。 自动类型转换(隐式) 1. 特点:代码不需要进行特殊处理,自动完成。 2. 规则:数据范围从小到大。 */ /* 在java中有一条非常重要的结论,必须记住: 在任何情况下,整数型的“字面量/数据”默认被当做int类型处理。(记住就行) 如果希望该“整数型字面量”被当做long类型来处理,需要在“字面量”后面添加L/l 建议使用大写L,因为小写l和1傻傻分不清。 */ public class Demo05Int { public static void main(String[] args){ // 分析这个代码存在类型转换吗,以下代码什么意思? // 不存在类型转换 // 100 这个字面量被当做int类型处理 // a变量是int类型,所以不存在类型的转换。 // int类型的字面量赋值给int类型的变量。 int a = 100; System.out.println(a); // 分析这个程序是否存在类型转换?存在 // 分析:200这个字面量默认被当做int类型来处理 // b变量是long类型,int类型占4个字节,long类型占8个字节 // 小容量可以自动转换成大容量,这种操作被称为:自动类型转换。 long b = 200; System.out.println(b); // 分析这个是否存在类型转换? // 这个不存在类型转换。 // 在整数型字面量300后面添加一个L之后,300L联合起来就是一个long类型的字面量 // c变量是long类型,long类型赋值给long类型不存在类型转换。 long c = 300L; System.out.println(c); // 存在类型转换吗?存在 // 2147481367默认被当做int来处理 // d变量是long类型,小容量可以自动赋值给大容量,自动类型转换 long d = 2147481367; System.out.println(d); // 编译器会报错吗?为什么? // 在java中,整数型字面量一上来编译器就会将它看做int类型 // 而2147483648已经超出了int的范围,所以在没有赋值之前就出错了。 // 记住,不是e放不下2147483648,e是long类型,完全可以容纳2147483648 // 只不过2147483648本身已经超出了int范围。 // long e = 2147483648 错误: 整数太大 // 怎么解决这个问题呢? long e = 2147483648L; System.out.println(e); } }
强制类型转换:把一个表示数据范围大的数值或者变量赋值给另一个表示数据范围小的变量。
- 特点:代码需要进行特殊的格式处理,不能自动完成。
- 格式:范围小的类型 范围小的变量名 = (范围小的类型) 原本范围大的数据;
代码演示,强制类型转换:
public class Demo02DataType { public static void main(String[] args) { // 左边是int类型,右边是long类型,不一样 // long --> int,不是从小到大 // 不能发生自动类型转换! // 格式:范围小的类型 范围小的变量名 = (范围小的类型) 原本范围大的数据; int num = (int) 100L; System.out.println(num);//100 } }
强制类型转换一般不推荐使用,因为有可能发生精度损失、数据溢出
public class Demo03DataType { public static void main(String[] args) { // long强制转换成为int类型,数据溢出 int num2 = (int) 6000000000L; System.out.println(num2); // 1705032704 // double --> int,强制类型转换,精度损失 int num3 = (int) 3.99; System.out.println(num3); // 3,这并不是四舍五入,所有的小数位都会被舍弃掉 } }
注意事项
- 强制类型转换不推荐使用
- 浮点转成整数,直接取消小数点,可能造成数据损失精度。
- 范围大的数据类型的值超过了范围小的数据类型的最大范围,则会出现数据溢出。
1. char类型的数据转换为int类型是按照码表中对应的int值进行计算的。比如在ASCII码表中,'a'对应97。
int a = 'a'; System.out.println(a); // 将输出97
2. 整数默认是int类型,byte、short和char类型数据参与运算均会自动转换为int类型。
public class Demo { public static void main(String[] args) { byte b1 = 10; byte b2 = 20; /* byte b3 = b1 + b2;代码会报错, b1和b2会自动转换为int类型,计算结果为int int赋值给byte需要强制类型转换。 */ // 修改为: int num = b1 + b2; // 或者: byte b3 = (byte) (b1 + b2); } }