logstash-output-mongodb实现Mysql到Mongodb数据同步

0、前提

1)已经安装好源数据库:Mysql;
2)已经安装好目的数据库:Mongodb;
3)已经安装好logstash及相关插件logstash-output-mongodb
安装步骤参考:http://blog.csdn.net/laoyang360/article/details/65448962

1、同步conf配置详解

[root@la bin]# cat ./logstash_jdbc_mongo/jdbc_mongo.conf
input {
  stdin {
  }
  jdbc {
  ‘# 源Mysql数据库地址
  jdbc_connection_string => "jdbc:mysql://20.18.11.4:3306/tech?zeroDateTimeBehavior=convertToNull"
  #源Mysql的用户名和密码
  jdbc_user => "root"
  jdbc_password => "rot123"

  ‘ #true代表记录最后存储的关联列值
  record_last_run => "true"
  use_column_value => "true"
  tracking_column => "id"
  ‘ #存储位置
  last_run_metadata_path => "/opt/logstash/bin/logstash_jdbc_mongo/mongo_info"
  clean_run => "false"

  ‘ #jdbc路径地址
  jdbc_driver_library => "/home/lib/mysql-connector-java-5.1.38.jar"
  ‘ # the name of the driver class for mysql
  jdbc_driver_class => "com.mysql.jdbc.Driver"
  jdbc_paging_enabled => "true"
  jdbc_page_size => "500"
‘ #以下对应着要执行的sql的绝对路径。
  statement_filepath => "/opt/logstash/bin/logstash_jdbc_mongo/jdbc_mongo.sql"
‘ #定时字段 各字段含义(由左至右)分、时、天、月、年,全部为*默认含义为每分钟都更新
schedule => "* * * * *"
  }
}

filter {
json {
  source => "message"
  remove_field => ["message"]
  }
}

’#输出mongodb的配置
output {
  stdout { codec => rubydebug }
  mongodb {
‘#对应mongodb的输出集合
  collection => "N_CLASS"
’#对应mongodb的输出数据库名称
  database => "data"
  uri => "mongodb://110.0.12.45:27017"
  }
}

2、需要同步表的sql

[root@lalogstash_jdbc_mongo]# cat jdbc_mongo.sql
select
*
from n_class
where n_class.id > :sql_last_value

3、小结

以上实现了Mysql数据库中的一个库表table 与 Mongodb中的一个集合collection之间的全量、增量同步操作。
全量的实现:通过sql语句实现;
增量的实现:通过定时、sql_last_value实现。
同步的时候,无需在mongodb做任何操作,同步后,既可以在mongodb的windows客户端:Robomongo看到同步后新增的集合collection。

4、题外话(欢迎留言讨论)

PS:以下链接涉及演讲主题“NoSQL之王——一分钟从关系型迁移到MongoDB”,但是目前为止,没有找到相关细节介绍PPT等资料。博友,谁有参与或者更好的同步方案欢迎评论探讨。
http://geek.csdn.net/news/detail/186266


作者:铭毅天下
转载请标明出处,原文地址:
http://blog.csdn.net/laoyang360/article/details/65449127

上一篇:大数据实践-数据同步篇tungsten-relicator(mysql->mongo)


下一篇:开源“Chaperone”:Uber是如何对Kafka进行端到端审计的