【DB吐槽大会】第19期 - PG 没有block level压缩

背景


1、产品的问题点

  • PG 没有block level压缩

2、问题点背后涉及的技术原理

  • PG 只有行级别压缩, 当1条记录压缩后的长度超过1/4 block size(约2000字节)(由参数 TOAST_TUPLE_THRESHOLD 控制阈值) 时, PG 会将其变长字段类型存储到TOAST切片.
  • 这种行级别的压缩方式压缩比较低

3、这个问题将影响哪些行业以及业务场景

  • 对存储的成本较为敏感的业务, 例如IOT, 时序, 冷数据, 冷仓库等.

4、会导致什么问题?

  • 压缩比低, 需要使用更多的存储空间, 导致存储成本较高

5、业务上应该如何避免这个坑

  • 更换产品,
  • 或使用FDW, 将数据存储在外部, 例如OSS_FDW将数据存储在OSS对象存储内, 使用外部廉价、高压缩比存储.

6、业务上避免这个坑牺牲了什么, 会引入什么新的问题

  • 管理成本增加
  • 使用oss_fdw外部存储, 不支持索引, 查询速度更慢.

7、数据库未来产品迭代如何修复这个坑

  • 内核层支持BLOCK级别的压缩,
  • 使用压缩效率、压缩比更高的算法
  • 使用列存储, 存储同类的数据, 比行+块级别压缩比更高.



上一篇:【DB吐槽大会】第46期 - PG copy不能跳过错误行


下一篇:【DB吐槽大会】第22期 - PG 不支持libpq协议层压缩