mongodb的ObjectId最后三个字节有趣的地方

ObjectId 由12个字节组成,其中组成如下:

a 4-byte timestamp value, representing the ObjectId’s creation, measured in seconds since the Unix epoch
a 5-byte random value
a 3-byte incrementing counter, initialized to a random value

前4个字节为以秒为单位的时间戳
中间5个字节为随机字符串
最后3个字节是一个随机数,并且递增

3个字节24位,也就是1秒内生成2的24次,即16777216个不重复的ObjectId。

但是请看文档中的描述,incrementing counter, initialized to a random value

当时我看到这里就想,为什么不能从0开始呢,比如某一秒的第一个 ObjectId 是5ebc0b522d5c8f0c0c【000000】,接着是5ebc0b522d5c8f0c0c【000001】5ebc0b522d5c8f0c0c【000002】 ... 一直到最大值,然后下一秒,又是从【000000】开始。

因为如果使用随机数,那么有可能某一秒的第一个 ObjectId 是5ebc0b522d5c8f0c0c【fffffe】,那接下来这一秒还需要生成 ObjectId,岂不是溢出了,不能用了?

后来实验了一下,发现不是我想象的那样。

在 shell 中执行 db.foo.insertOne({ t: "t" }),发现随机数的递增与时间戳无关,也就是当前连接第一次生成随机数后,后面执行的操作都会使用这个随机数递增,而不会生成另一个随机数。

第一次执行,生成ObjectId如 {这一秒的时间戳}{随机字符串}28c060
下一个ObjectId => {这一秒的时间戳}{随机字符串}28c061
下一个ObjectId => {这一秒的时间戳}{随机字符串}28c062
......
一直到最大值,然后再从 000000 开始算起

所以 mongodb 确实是能在1秒内生成不重复的16777216个ObjectId

注意,随机字符串在同一个 shell 连接中是相同的。

插个题外话:mongodb从3.4版本开始,中间5个字节就已经改为随机字符串了,而不是3个字节表示机器标识码+2个字节表示进程号。至于为什么,官网没说,可以看其他开发者的猜想

上一篇:30 个 ElasticSearch 调优知识点,都给你整理好了!


下一篇:运维必经操作,TcaplusDB tcapsvr扩缩容介绍