开发者学堂课程【SaaS 模式云数据仓库系列课程 —— 2021数仓必修课:DataWorks 批量生成同步任务】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/55/detail/1194
DataWorks 批量生成同步任务
内容简介:
一、增库迁移
二、批量上云
三、分库分表
一、概念讲解
适用场景是批量生成同步任务,假设数据库内有 100 张表,您原本可能配置 100 次数据同步任务,但通过整库迁移或批量上云可以一次性完成。
整库迁移:
支持 MySQL、PostgreSQL、SQLServer、DRDS?PorlarDB
批量上云:
目前仅支持 MySQL、SQLserver、Oracle 数据源。
二、步骤
添加数据源
1. 新增数据源
2. 批量新增数据源
3. 克隆数据源
在添加的数据源入口看到入口,批量上云支持的规则多,增量配置模式有两种,根据字数自己选择,后台会转换为设口,过滤每日增量,同步增量,日增量。
如果您每日上传有特殊业务逻辑,而非一个单纯的数字可以标识,目前数据集成支持有效数据支撑。
同步并发设置,避免负载过大,几个任务同时上传,批量上云,配置完后看效果DDL,分库分表,多库多表。
注意:
配置分库分表任务前提条件
1、源端的表结构要相同
2、不同的数据库密码相同
3、多个库要增加多个数据源