关于String类中的hashcode的相关整理

为什么JavaString哈希乘数选择31?

关于String类中的hashcode的相关整理

  • 31是奇素数(可以充分利用原始数据包含的信息)
  • 哈希分布比较均匀。偶数的冲突率很高,只有少数例外。小乘数(1-20)的冲突率也很高
  • 哈希计算很快。选用31是JVM的一种优化。位移和减法操作比乘法操作快速 31*hash=(hash<<5)-hash;
  • 31和33的计算速度和哈希分布基本一致,整体表现好(大于31,33的奇数虽然效果也不错,但是31和33的移位是最少的,理论上是最快的)

hashtable中索引的位置计算为什么是0X7FFFFFFF

  返回x在hashtable中的索引      
  int index =  (x.hashCode() & 0x7fffffff )%table.length;

0x7fffffff起到了符号屏蔽的作用,因为hashcode有可能为一个负数,与运算之后可以确保得到的index是一个整数,从而通过index索引号获得数据。(hashcode可以直接定位到散列表中位置)

参考:

为什么Java String哈希乘数为31?:https://blog.****.net/zhanjia/article/details/84923530
经典Times33哈希算法:https://mp.weixin.qq.com/s/5DldaWJ8D1WMtUirfdOt6Q
Java提高篇之hashCode(里面讲了很多关于hashmap,hashtable,hashcode的东西):http://www.importnew.com/20381.html