细读源码之Java String(二)

Java中的String类绝对是使用最广泛的类,本文就带着大家细读一下JDK8下的String源码(接上篇)

2.String.hashCode方法

String类重写了Object的hashCode方法,代码如下:

细读源码之Java String(二)

hashCode方法的计算过程非常简单,不断执行h = 31 * h + val[i]。这里有个问题需要考虑,乘数为什么选择31而不是其他?

A.当乘数的是31时,编译器可以对乘法运算进行优化,将一次乘法运算优化成1次位运算和一次减法运算:N * 31 = N * 32 - N = (N << 5) - N;

B.从离散数学的角度,选择一个不大不小的质数,可以使得hash的值有更加均匀的分布,具体证明有兴趣的同学可以自己研究,纯数学问题;

C.从统计的角度,对于所有常用的单词(Unix下存储在/usr/share/dict/words路径下),选择不同的乘数,看看最后hash的分布情况,这里选择jfreechart做画图工具,来展示Hash分布,实现过程如下:

添加maven依赖:

细读源码之Java String(二)

代码实现:

细读源码之Java String(二) 

 细读源码之Java String(二)

 细读源码之Java String(二)

 细读源码之Java String(二)

 细读源码之Java String(二)

 细读源码之Java String(二)

 上面代码执行结果,如下图所示:

细读源码之Java String(二)

从上图可以看出,乘数选择31,最后hash值,分布还是比较均匀的。综上,最终hash的乘数选择了31。

3.字符串匹配的方法:

细读源码之Java String(二)

 细读源码之Java String(二)

 

上一篇:关于XDU大一加权均分的灵敏度分析


下一篇:帕德逼近和函数综合问题