1. pg_dump 使用及示例

1.pg_dump 概述

1.1 pg_dump 介绍

https://www.postgresql.org/docs/14/app-pgdump.html
pg_dump是用于备份一种PostgreSQL数据库的工具。即使数据库正在被并发使用,它也能创建一致的备份。pg_dump不阻塞其他用户访问数据库(读取或写入)。
pg_dump只转储单个数据库。要备份一个集簇或者集簇中 对于所有数据库公共的全局对象(例如角色和表空间),应使用 pg_dumpall

可以选择一个数据库或部分表进行备份,恢复过程可以跨平台迁移
可以在数据库正在使用时进行完整一致的备份,并不阻塞其它用户对数据库的访问
只能备份单个数据库,不会导出角色和表空间相关的信息

1.2 pg_dump四种转储格式

Plain、custom、directory、tar
Plain 是纯文本格式跟pg_dumpall转储一样。你可以用psql加载它,如果转储很大,提取部分可能会很复杂。
使用pg_restore程序恢复所有其他格式(custom,directory和tar)

Pg_dump四种转储格式:
-F t  tar格式的转储输出格式,不支持压缩,在早期版本有单表8G限制,目前版本已经改善
-F d 以目录的格式创建备份,备份出来的是一个包含若干个目录的备份文件,可以指定并行备份-j
-F c 备份为二进制格式, 压缩存储. 并且可被pg_restore用于精细还原,输出输入 IO 比较稳定
-F p 备份为文本, 大库不推荐, 文本方式 ,对 IO 不可控,不稳定

1. pg_dump 使用及示例

2.pg_dump 使用

pg_dump --help

2.1 Usage:

  pg_dump [OPTION]... [DBNAME]

2.2 General

一般选项:
  -f, --file=FILENAME          输出文件或目录名 
  -F, --format=c|d|t|p         输出文件格式 (custom, dir, tar)  tezt(默认值)) 
  -j, --jobs=NUM               执行多个并行任务进行备份转储工作
  -v, --verbose                详细模式
  -V, --version                输出版本信息,然后退出
  -Z, --compress=0-9           被压缩格式的压缩级别
  --lock-wait-timeout=TIMEOUT  在等待表锁超时后操作失败
  --no-sync                    不需要等待,执行刷盘
  -?, --help                   显示此帮助, 然后退出

2.3 output content

控制输出内容选项:
  -a, --data-only              只转储数据,不包括模式
  -b, --blobs                  在转储中包括大对象
  -B, --no-blobs               在转储中排除大对象
  -c, --clean                  在重新创建之前,先清除(删除)数据库对象      *****
  -C, --create                 在转储中包括命令,以便创建数据库
  -E, --encoding=ENCODING      转储以ENCODING形式编码的数据
  -n, --schema=PATTERN         只转储指定名称的模式
  -N, --exclude-schema=PATTERN 不转储已命名的模式
  -O, --no-owner               在明文格式中, 忽略恢复对象所属者
  -s, --schema-only            只转储模式, 不包括数据
  -S, --superuser=NAME         在明文格式中使用指定的超级用户名
  -t, --table=PATTERN          只转储指定名称的表
  -T, --exclude-table=PATTERN  不转储指定名称的表
  -x, --no-privileges          不要转储权限 (grant/revoke)

  --binary-upgrade             仅供升级实用程序使用
  --column-inserts             以带有列名的INSERT命令形式转储数据
  --disable-dollar-quoting     取消美元 (符号) 引号, 使用 SQL 标准引号
  --disable-triggers           在恢复数据的过程中禁用触发器
  --enable-row-security        启用行安全性(只转储用户能够访问的内容)
  --exclude-table-data=PATTERN  不转储指定名称的表中的数据
  --extra-float-digits=NUM     覆盖 extra_float_digits 的默认设置
  --if-exists                  当删除对象时使用IF EXISTS
  --inserts                    以INSERT命令,而不是COPY命令的形式转储数据

  --load-via-partition-root    通过根表加载分区
  --no-comments                不转储评论
  --no-publications            不转储出版物
  --no-security-labels         不转储安全标签分配
  --no-subscriptions           不转储订阅
  --no-synchronized-snapshots  在并行作业中不使用同步快照
  --no-tablespaces             不转储表空间分配
  --no-unlogged-table-data     不转储未记录的表数据
  --on-conflict-do-nothing     添加 ON CONFLICT DO NOTHING 到 INSERT 命令
  --quote-all-identifiers      引用所有标识符,即使不是关键字
  --rows-per-insert=NROWS      每个插入的行数;暗示 --inserts
  --section=SECTION            转储命名节(前数据、数据或后数据)
  --serializable-deferable     等到转储可以无异常运行
  --snapshot=SNAPSHOT          使用给定的快照进行转储
  --strict-names               要求表和/或模式包含模式以匹配每个至少一个实体
  --use-set-session-authorization
                               使用 SET SESSION AUTHORIZATION 命令而不是 ALTER OWNER 命令来设置所有权

2.4 Connection options

Connection options
  -d, --dbname=DBNAME          对数据库 DBNAME备份
  -h, --host=HOSTNAME          数据库服务器的主机名或套接字目录
  -p, --port=PORT              数据库服务器的端口号
  -U, --username=NAME          以指定的数据库用户联接
  -w, --no-password            永远不提示输入口令
  -W, --password               强制口令提示 (自动)
  --role=ROLENAME              在转储前运行SET ROLE    

3. pg_dump 示例

3.1 默认的文本方式

# 备份数据库
pg_dump -Fp-f/tmp/testdb.sql  -C -E  UTF8 -h 127.0.0.1 -U postgres testdb  
#或 简单语法 ,默认就是文本的方式
pg_dump testdb >/tmp/testdb.sql                                                                      

# 将数据恢复到 testdb1   , 导入数据时首先创建数据库
createdb testdb1
psql  testdb1</tmp/testdb.sql

3.2 二进制备份文件

#二进制格式备份文件, 指定类开 -F c
pg_dump -F c -f  /tmp/testdb.dmp  -C -EUTF8 -h 127.0.0.1 -U postgres testdb

#可选,解析二进制格式的备份文件 ,查看二进制文件的备份内容
pg_restore      -f   /tmp/a.log       /tmp/testdb.dmp        
#可选,-l  生成备份集的toc例表,可以编辑该toc文件 ,注释其中的表,恢复部份对象
pg_restore -l  -f   /tmp/a.toc    /tmp/testdb.dmp     

# 二进制格式 ,tar 格式 ,目录格式 ,都需要用pg_restore 来恢复 
pg_restore -d testdb1   /tmp/testdb.dmp     #需要先创建目标库,还原恢复

4.pg_dump 扩展

4.1.生成toc文件进行选择性恢复

1)根据二进制备份文件生成toc文件
    pg_restore -l -f /tmp/toc1 /tmp/testdb.dmp
2)修改 toc文件,以首行加分号“;”的方式注释掉不用还原的内容
vi /tmp/toc1 
    265; 1259 25280 TABLE public postgres_log postgres
    266; 1259 25293 TABLE public t2 postgres
    213; 1259 16385 TABLE public test postgres
    3660; 0 25280 TABLE DATA public postgres_log postgres
    ;3661; 0 25293 TABLE DATA public t2 postgres                                      # 这个表用;  注释了,不会恢复
    ;3659; 0 16385 TABLE DATA public test postgres                                   # 这个表用;  注释了,不会恢复
    3520; 2606 25287 CONSTRAINT public postgres_log postgres_log_pkey postgres
    3442; 1259 25269 INDEX public idx_test postgres

3)以toc文件列表做恢复
    pg_restore –F c -L /tmp/toc -d testdb  /tmp/testdb.dmp

4.2使用unix管道备份恢复

1. 压缩与解压
pg_dump testdb| gzip > /tmp/testdbbak.sql.gz      #操作系统压缩
gunzip -c /tmp/testdbbak.sql.gz | psql testdb2      #解压缩恢复

2.备份恢复数据不落盘
pg_dump testdb | psql testdb1      #备份testdb  ,马上又还原到 testdb1,testdb1库要先创建, 数据不落盘,这路对小数据进行测试是非常方便的。   

3.分割备份文件 
备份: pg_dump dbname | split-b1m- filename
恢复: catfilename* | psql dbname

4.3.并行处理

pg_dump -Fd -j4 -f /tmp/db.dir testdb     #-F d 以目录的格式创建备份
pg_restore -d testdb3 -j4 /tmp/db.dir
-j 参数指定同时几个进程来同时执行,每个进程同时只处理一个表的数据。

5.补充

逻辑备份,相对灵活,可以排除大表。 可以结合物理备份使用。
如果备份以默认的明文方式保存,输出输入 IO 不可控,生产环境中建议使用 -F c 二进制方式备份比较稳定 。



来自为知笔记(Wiz)

上一篇:pg substring 正则提取子串


下一篇:4.pg_bulkload 数据加载使用及示例