实时电商数仓(九)之数据采集(八)数据库数据采集(三)canal安装

1  mysql的准备

1.1 导入模拟业务数据库

1.2 赋权限

   在mysql中执行

GRANT SELECT, REPLICATION SLAVE, REPLICATION CLIENT ON *.* TO 'canal'@'%' IDENTIFIED BY 'canal' ;

 1.3 修改/etc/my.cnf文件

server-id= 1
log-bin=mysql-bin
binlog_format=row
binlog-do-db=gmallXXXXX

1.4 重启Mysql

2 canal 安装

2.1 canal的下载 

https://github.com/alibaba/canal/releases

把canal.deployer-1.1.4.tar.gz拷贝到linux,解压缩

2.2 修改canal的配置

vim conf/canal.properties

这个文件是canal的基本通用配置,主要关心一下端口号,不改的话默认就是11111

实时电商数仓(九)之数据采集(八)数据库数据采集(三)canal安装

 

 

 实时电商数仓(九)之数据采集(八)数据库数据采集(三)canal安装

vim conf/example/instance.properties

instance.properties是针对要追踪的mysql的实例配置

实时电商数仓(九)之数据采集(八)数据库数据采集(三)canal安装

 

 

 实时电商数仓(九)之数据采集(八)数据库数据采集(三)canal安装

 

 

 实时电商数仓(九)之数据采集(八)数据库数据采集(三)canal安装

2.3  把canal目录分发给其他虚拟机

 

2.4 在2-3台节点中启动canal 

启动canal

./bin/startup.sh

实时电商数仓(九)之数据采集(八)数据库数据采集(三)canal安装

2.5 只是高可用,不是高负载

     这种zookeeper为观察者监控的模式,只能实现高可用,而不是负载均衡,即同一时点只有一个canal-server节点能够监控某个数据源,只要这个节点能够正常工作,那么其他监控这个数据源的canal-server只能做stand-by,直到工作节点停掉,其他canal-server节点才能抢占。

3 kafka客户端测试

 

/bigdata/kafka_2.11-0.11.0.2/bin/kafka-console-consumer.sh --bootstrap-server  hadoop1:9092,hadoop2:9092,hadoop3:9092 --topic  GMALL2020_DB

 

上一篇:Oh! Binlog还能这样用之Canal篇


下一篇:Canalv1.1.4版本搭建HA集群