背景
场景:
分析业务, 任意字段、任意维度组合, 组合等值查询.
where a=? and b=? or c=? . 其他组合 ab ac ad bc bd bcd bdef def ... 每个字母代表一个字段.
在电商、金融等拖拽式实时分析场景中尤为常见.
挑战:
由于查询维度非常多, 完全不可控, 如果每个维度都预计算, 会导致结果数据量指数级增加.
如果为每个查询维度都创建一个索引, 那么会有N!+1个索引. 例如5个字段的任意组合有121种, 需要建121个索引, 完全不现实.
PG 解决方案:
使用bloom布隆过滤索引. 每个value被hash计算后映射到若干个bit位, 这些bit位被设置为1表示包含这个value.
一个索引即可满足任意维度的组合等值搜索.
https://www.postgresql.org/docs/14/bloom.html