什么是基数?
A{1,3,5,7,8,7}
B{1,3,5,7,8}
基数(不重复的元素)=5,可以接受误差!
简介
redis 2.8.9 更新了Hyperloglog , 基数统计的算法
优点:占用的内存是固定,2^64不同的元素的基数,只需12KB内存!
网页的UV(访问量):
传统的方式,set保存用户id,统计set中的元素数量为标准,这个方式保存大量的用户id,就比较麻烦,我们的目的是计数,不是保存id
0.81%错误率,统计UV任务,可以忽略不计。
测试使用
127.0.0.1:6379> PFadd mykey a b c d e f g h i j k
(integer) 1 //创建第一组元素
127.0.0.1:6379> PFCOUNT mykey
(integer) 11 //统计基数数量
127.0.0.1:6379> PFADD mykey2 b c d e f g h i j k l
(integer) 1 //创建第二组元素
127.0.0.1:6379> PFCOUNT mykey2
(integer) 11
127.0.0.1:6379> PFMERGE mykey3 mykey mykey2
OK //合并两组++
127.0.0.1:6379> PFCOUNT mykey3
(integer) 12
redis学习-三种特殊数据类型-Hyperloglog