如何将大型mysql转储导入hadoop?

我需要将*转储(mysql表,解压缩文件大约50gb)导入Hadoop(hbase).现在我首先将dump加载到mysql中,然后将数据从mysql传输到hadoop.但是将数据加载到mysql需要大量的时间 – 大约4-7天.是否可以直接将mysql转储加载到hadoop(通过一些转储文件解析器或类似的东西)?

解决方法:

据我记忆 – MySQL Dumps几乎完全是插入语句的集合.您可以在映射器中解析它们并按原样处理…如果您只有几个表,则在Java中进行硬编码解析应该是微不足道的.

上一篇:我如何将表从mysql导入到hbase?


下一篇:当设计模式遇上 Hooks