数据类型优化:
对Mysql数据类型的优化有下面几点原则,在实际使用的时候大家可以适当采取使用。
1.更小更好
我们在选择数据类型的时候,应该尽量使用可以正确存储数据的最小数据类型,更小的数据类型通常更快,因为它们占用更少的磁盘、内存和CPU缓存,并且处理时需要的CPU周期更少,但是要确保没有低估需要存储的值的范围,如果无法确认哪个数据类型,就选择你认为不会超过范围的最小类型。
2.简单就好
简单数据类型的操作通常需要更少的CPU周期,例如,
1、整型比字符操作代价更低,因为字符集和校对规则是字符比较比整型比较更复杂,
2、使用mysql自建类型而不是字符串来存储日期和时间
3、用整型存储IP地址
案例说明:
两张相同的表数据类型不一样,执行时间不一样
通过查看两张表的表结构:
查看执行时间:
3.尽量避免null
如果查询中包含可为NULL的列,对mysql来说很难优化,因为可为null的列使得索引、索引统计和值比较都更加复杂,坦白来说,通常情况下null的列改为not null带来的性能提升比较小,所有没有必要将所有的表的schema进行修改,但是应该尽量避免设计成可为null的列
4.具体细则:
整型:
可以使用的几种整数类型:TINYINT,SMALLINT,MEDIUMINT,INT,BIGINT分别使用8,16,24,32,64位存储空间。
尽量使用满足需求的最小数据类型
字符和字符串类型:
前置知识:
在进行数据存储的时候,你可以把磁盘想象成n多个小格子,每一个小格子都是4kb的大小,叫做页。
局部性原理:值的是数据有聚集成群的倾向,并且这次被访问到的数据,下次可能再被访问到。
磁盘预读:每次在读取数据的时候会把临近的4k数据都读进来,虽然有些数据不是需要的吗,但是可能在下一次读取的时候回用到。
具体的原理可查看下面的博客。
https://blog.csdn.net/xd_1437/article/details/103253632
varchar:
特点:
- 使用最小的符合需求的长度。
- varchar(n) n小于等于255使用额外一个字节保存长度,n>255使用额外两个字节保存长度。
- varchar(5)与varchar(255)保存同样的内容,硬盘存储空间相同,但内存空间占用不同,是指定的大小 。
- varchar在mysql5.6之前变更长度,或者从255一下变更到255以上时时,都会导致锁表。
使用场景:
1、存储长度波动较大的数据,如:文章,有的会很短有的会很长
2、字符串很少更新的场景,每次更新后都会重算并使用额外存储空间保存长度
3、适合保存多字节字符,如:汉字,特殊字符等
char:
特点:
1、最大长度:255
2、会自动删除末尾的空格
3、检索效率、写效率 会比varchar高,以空间换时间
使用场景:
1、存储长度波动不大的数据,如:md5摘要
2、存储短字符串、经常更新的字符串
Blob和text类型:
MySQL 把每个 BLOB 和 TEXT 值当作一个独立的对象处理。
两者都是为了存储很大数据而设计的字符串类型,分别采用二进制和字符方式存储。
注意:虽然说是Mysql支持这样的数据,但是在工作中用的是比较少的,原因在于这样长的字符串检索的时候效率比较低,一般都是单独进行存储。例如,音乐文件,Json文件或者其他文件,可以直接放在FTP文件系统中,在数据库中保存文件的地址,然后读取的时候,直接取出地址读取即可。
datetime与timestamp:
数据库中支持的日期类型数据一般有三种:
Datetime:
占用8个字节,与时区无关,数据库底层的时区匹配对datetime=无效,可以精确到毫秒,可保存的时间范围也比较大
timestamp:
占用4个字节,采用整型进行存储,精确到秒,表示时间范围是1970年1月1号到2038年1月19号
依赖数据库的时区设置,自动更新timestamp列的值
date:
占用3个字节,可以使用日期函数进行日期的计算,date类型用于保存1000-01-01到9999-12-31之间的日期
使用枚举代替字符串类型:
有时可以使用枚举类代替常用的字符串类型,mysql存储枚举类型会非常紧凑,会根据列表值的数据压缩到一个或两个字节中,mysql在内部会将每个值在列表中的位置保存为整数,并且在表的.frm文件中保存“数字-字符串”映射关系的查找表
create table enum_test(e enum(‘fish‘,‘apple‘,‘dog‘) not null);
insert into enum_test(e) values(‘fish‘),(‘dog‘),(‘apple‘);
select e+0 from enum_test;
特殊类型:
人们经常使用varchar(15)来存储ip地址,然而,它的本质是32位无符号整数不是字符串,可以使用INET_ATON()和INET_NTOA函数在这两种表示方法之间转换
案例:
select inet_aton(‘1.1.1.1‘)
select inet_ntoa(16843009)