char
char是定长的,插入数据不足规定长度的,右边补空格,当然查询出来的数据也会有空格,插入数据超过规定长度,会返回错误[22001][1406] Data truncation: Data too long for column ‘name‘ at row 1
,MySQL
并不会自动截短字符串。因为char是定长的,所以查询的效率比varchar高(后面会将为什么效率高),但在列容量不能充分利用的情况下会造成一定的空间浪费。
varchar
varchar是不定长的,varchar类型的列是不定长的,在5.0版本以后的最大长度是65535字节(2^16),但是这个长度只是“系统长度”,这并不意味着你真的可以完全利用65535字节来存储数据,因为varchar是不定长的,所以需要前两个字节标记字段的实际长度,结尾还要用一个字节表示结束,这可以用u盘来说明,买到一个256G的u盘,用工具查看u盘的实际容量时,会发现不足256G,因为系统也要占用一部分。
需要注意的是65535只是字节个数,而且是理论字节个数,在减去头尾的"系统"占用字节后,只剩下65532可用字节。那么我们建表的时候,能不能直接写varchar(65532)呢?当然是不可以的,因为4.0之后,varchar后面的小括号里就不再是字节长度了,而是字符长度。
字节和字符个数之间的换算关系是根据编码决定的:
编码 | 长度 |
---|---|
utf8 | 65532/3=21844(汉字占3个字符) |
utf8mb4 | 65532/4=16383(汉字占4个字符,包含了生僻汉字和文字表情) |
我们只列出了常用的编码格式。
那么这是否意味着,在utf8mb4编码下我们可以用varchar(16383)来定义一个列呢?
答案是要看情况,MySQL规定了一个row
所有的字段加起来总长度不能超过65535字节,所以如果一个表只有一个列,那完全可以用varchar(16383)来定义这个列,如果这个表还有其他列,无论其他列多么短,都是会占用字节数的,所以,使用varchar(16383)来定义的时候,MySQL
会返回错误提示:ERROR 1118 (42000): Row size too large. The maximum row size for the used table type, not counting BLOBs, is 65535. You have to change some columns to TEXT or BLOBs
,意思是row的容量太大,超出了row的最大容量65535,如果不改变列的长度的话,推荐使用TEXT or BLOBs
类型。
所以,如果我们要创建一个只包含两个字段的表(编码是utf8mb4),一列是主键,一列是字符串,字符串的最大长度是多少呢?你可以先自己算一下,再往下看。
列 | 长度 |
---|---|
id | int(11) |
article | varchar((65535-4)/4=16382) |
为什么65535要减去4呢?因为int(11)占4个字节,那么在utf8编码情况下,还是同样的数据结构,article的最大长度有事多少呢?
列 | 长度 |
---|---|
id | int(11) |
article | varchar((65535-4)/3=21843) |
相信这次你一定算对了。
为什么char类型查询效率高
这是由他们在磁盘上存放的不同形式决定的,我们先来看一个图:
我们可以看到char类型在存放数据的时候,中间是没有间隔的,数据本身是有空格的,但是数据段之间没有间隔,因为我们在创建列的时候已经告诉
MySQL
列的长度了,MySQL
在查询数据的时候,只需要按部就班寻找就行了,不需要在中途计算这个数据段的长度。
但是varchar类型的存放就不同了,在每个数据段开头,都要有一段空间(1~2个字节)存放数据段的长度,在数据段的结尾还有一段空间(1个字节)标记此字段的节数。MySQL
在读取一个数据段的时候,首先要读开头,比如读到了3,说明数据段的长度是3,之后就不多不少,只读3个字节。所以MySQL
在遍历数据的时候,磁针要比char类型的列多读很多次磁盘来获取字段的真实长度,这就是为什么varchar比char查询效率低的原因了。
应用
我们可以用varchar存放不定长的数据,比如人的名字,或者一篇博客的文章。可以用char存放定长的数据,比如身份证号和手机号,我们把一个列定义为mobile char(11)
,*的手机号最长,达到11位,香港是8位,瑞士是10位,所以定义成11位完全够用,可以存放各国的手机号了。
附加
除了char和varchar类型,最常用的就是数值类型了,为了方便建表的时候计算列的最大长度,把数值类型占用的字节和值的范围放在这里: