6 HBase 上的MapReduce
在HBase系统上运行批处理运算,最方便和实用的模型依然是MapReduce,如下图:
HBase table和region的关系,比较类似HDFSfile和block的关系,HBase提供了配套的TableInputFormat和TableOutputFormat API,可以方便的将HBase table作为Hadoop MapReduce的source和sink,对于MapReduce job应用开发人员来说,基本不需要关注HBase系统自身的细节。