1.数据导出工具dumpling
1.1 介绍
dumpling 是逻辑备份也是热备份。
1.2 架构和特点
1.3 dumpling的适用场景和不适用场景
1.4 dumpling的部署与所需权限
(1)部署
共有两种方式。
(2)所需权限
1.5 dumpling导出sql文件
-r:表示单个文件导出的最大行数。会开启表内的并发加速。
-F:表示单个文件的最大大小。
1.6 dumpling导出csv文件
1.7 dumpling对导出数据进行筛选
(1)where
注意:where只能用于导出文件类型是csv类型时,sql类型where目前并不支持。
(2)filter
(3)-B或-T
1.8 导出的数据格式
(1)metadata
(2)建库语句
(3)建表语句
(4)存储数据
1.9 导出数据的一致性
snapshot采用MVCC机制,以时间戳备份。
flush:将全库都锁住。
lock:将全表都锁住。
consistency:控制导出数据的一致性方式。
1.10 dumpling的性能优化
1.11 随堂练习
(1)
答案:AC
解析:dumpling不支持增量备份,数据量较大的场景推荐使用BR。
(2)
答案:D
解析:snapshot是默认选择。
2.数据导入工具Lightning
2.1 介绍
2.2 原理
DDL:建表语句。
2.3 使用场景
2.4 支持的数据格式
2.5 后端backend
选择后端的建议:
2.6 部署需求
(1)硬件需求
(2)部署
(3)配置
(4)启动
(5)退出
2.7 Lightning断点续传
2.8 Lightning数据过滤
2.9 web界面管理
2.10 随堂练习
(1)
答案:ABC
解析:TiDB Lightning的filter功能使得其支持只导入某个schema的数据,TiDB Lightning在导入过程中会自动将TiKV集群切换为导入模式。