【DB吐槽大会】第9期 - PG 大量连接写小事务性能差

背景


1、产品的问题点

  • 大量连接写小事务性能差

2、问题点背后涉及的技术原理

  • PG判定事务可见性依赖事务快照, 结构为:ProcArray, 事务启动时、RC事务隔离级别的Statement执行开始时都要加ProcArray共享锁, 写操作的事务结束时需要加ProcArray排他锁. 高并发写操作发生时容易产生ProcArray排他锁冲突. 虽然procarray是有hash分区每次只锁映射的分区来降低排他锁冲突, 但是连接过多的情况下冲突依旧明显.

3、这个问题将影响哪些行业以及业务场景

  • 读写频繁、高并发(大量连接, 通常指超过5000个连接)小事务的业务. 例如2C的SaaS类场景.

4、会导致什么问题?

  • 高并发写操作发生时容易产生ProcArray排他锁冲突. 性能下降. 上万连接的高并发写操作性能可能降低到1000 tps以内.

5、业务上应该如何避免这个坑

  • 使用连接池, 降低总连接数.
  • 如果应用程序本身不具备连接池的能力, 使用pgbouncer这类中间连接池

6、业务上避免这个坑牺牲了什么, 会引入什么新的问题

  • 管理更加复杂
  • pgbouncer引入后, 必须是要statement或transaction level连接池, 从而无法使用prepared statement, 导致query parse,rewrite,plan的开销增加.

7、数据库未来产品迭代如何修复这个坑

  • 内置线程池
  • 对事务快照进行 CSN 或 CTS 改造



上一篇:【DB吐槽大会】第7期 - PG slot 无failover


下一篇:【DB吐槽大会】第4期 - PG 逻辑日志只有全局开关