在数据库主键设计上,比较常见的方法是采用自增ID(1开始,每次加1)和生成GUID。
数据库自增主键保证唯一性,但在分布式系统中,部署需要考虑的因素太多;GUID设计简单,能保证主键的唯一性,分布式系统中,数据库部署也简单,只是GUID是一串无物理意义的字符串,大量数据查询的时候效率相对会打折,存储暂用率也有些高。
snowflake算法的好处有两点:一是纯数字,二是整体上来说是按时间顺序的
参考:https://www.cnblogs.com/lilunjia/p/7109739.html
粗糙的原理解释:
大体上,取时间戳的有序递增性得到不同的id;由于高并发的场景,毫秒级别已经不能满足主键的唯一性(同一毫秒内插入多条数据是高并发系统中寻常需求)。因此加入机器码和计数器;
首先有一个元素存储上一个时间戳,每次生成主键会跟上一个时间戳做对比,如果当前生成的时间戳比上一个时间戳还要小,证明当前机器的系统时间有错误,抛出异常。
如果当前时间比上一个时间戳大,此时的逻辑最简单了。很容易得到一个唯一的主键,时间空间上唯一。那么,经过雪花算法后将会得到一个固定长度的唯一主键,然后将计数器置零,把当前时间戳保存为上一时间戳以待下次使用。
如果当前时间与上一个时间是相等的,那么就需要在毫秒级别内做序列号,启动12位序列号,计数。再经过雪花算法后得到一个固定长度的唯一主键。