EX. 业务原因: hbase 的 region 是将范围内的rowkey 放一起
但是如果某一段时期数据量大 , 就会造成region(分区) 数据的分布不均 , ,所以需要加盐 ,加哪里 ,放最前面
int num = 1000;
String rowkey_ori="2015880524002300_1232";
int saltCode=rowkey_ori.hashCode()%num;
if(saltCode>0){
String rowkey = String.format("%04d", saltCode)+rowkey_ori;
}else {
String rowkey = String.format("%04d", -saltCode)+rowkey_ori;
}
解释:我这里是1000个分区
第一个rowkey_ori 指的是之前的原始数据
saltCode指的是根据哈希值取整 , 除1000取余数 , 那么就会得到 0-999 ,然后根据salCode
另外 , 哈希值可以是负数 , 所以我加了判断