HashMap源码注解和相关面试问题汇总答疑
整合网上摘抄的和自己的理解
一、相关参数
1、默认初始容量
static final int DEFAULT_INITIAL_CAPACITY = 1 << 4;
必须是2的n次幂
2、负载因子
DEFAULT_LOAD_FACTOR = 0.75f;
3、扩容阀值
int threshold; (容量capacity*负载因子load factor),当元素个数大于阀值,触发扩容,并发请求下两个线程同时触发扩容,在移动节点时会导致一个链表中的2个节点相互引用,从而生成环链表
二、问题
1、数据存储结构是什么?
2、容量为什么是2的倍数?
长度16或者其他2的幂,length - 1的值是所有二进制位全为1,这种情况下,index的结果等同于hashcode后几位的值只要输入的hashcode本身分布均匀,hash算法的结果就是均匀的。HashMap的默认长度为16,是为了降低hash碰撞的几率
(n - 1) & hash,当n为2次幂时,会满足一个公式:(n - 1) & hash = hash % n,得到的索引在0~(n-1)之间
3、为什么建议设置HashMap的初始化容量
如果我们没有设置初始容量大小,随着元素的不断增加,HashMap会发生多次扩容,而HashMap中的扩容机制决定了每次扩容都需要重建hash表,是非常影响性能
4、数据迁移是怎么实现的?
通过hash & oldCap 计算索引位置,拆分原来的链表结构,如果为0则位置不变加入到原链表,否则新索引位置=原索引+oldCap,加入到新的链表。
至于为什么hash & oldCap能计算索引是否改变,看查看这个博客https://segmentfault.com/a/1190000015812438?utm_source=tag-newest
5、HashMap,LinkedHashMap,TreeMap,HashTable,ConcurrentHashMap 有什么区别?
a)HashTable 是线程安全的,使用一把锁(锁住整个链表结构)处理并发问题,多个线程竞争一把锁,容易阻塞
b)ConcurrentHashMap 1.8 中使用 CAS + synchronized + Node + 红黑树。锁粒度:Node(首结点)(实现 Map.Entry<K,V>)。锁粒度降低了。
c)HashMap 的键值对允许有null,非线程安全
d)LinkedHashMap 保存了记录的插入顺序,在用 Iterator 遍历时,先取到的记录肯定是先插入的;遍历比 HashMap 慢;在需要输出的顺序和输入的顺序相同的情况下。
e)TreeMap 实现 SortMap 接口,能够把它保存的记录根据键排序(默认按键值升序排序,也可以指定排序的比较器) 在需要按自然顺序或自定义顺序遍历键的情况下;
三、插入值put和扩容源码部分注解
final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
Node<K, V>[] tab;
Node<K, V> p;
int n, i;
//数组table为空
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;
//等同于 hash%(n-1) 这样得到的索引范围是0~15,防止数组溢出
i = (n - 1) & hash;
//如果当前索引所在位置的值为null,插入node
if ((p = tab[i]) == null)
tab[i] = newNode(hash, key, value, null);
else {
Node<K, V> e = null;
K k;
//如果hash值相同并且key相同赋值给变量e
if (p.hash == hash && ((k = p.key) == key || (key != null && key.equals(k))))
e = p;
// else if (p instanceof TreeNode)
// e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
for (int binCount = 0; ; ++binCount) {
//如果p.next值为空,将新值链表方式接入到p.next,终止继续迭代链表
if ((e = p.next) == null) {
p.next = newNode(hash, key, value, null);
//如果链表的长度大于8,把链表结构改成红黑树
// if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
// treeifyBin(tab, hash);
break;
}
//如果p.next不为空并且key和当前的key相同,那么取出当前node并返回
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
//更新node对应的值
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
return oldValue;
}
}
++modCount;
if (++size > threshold)
resize();
// afterNodeInsertion(evict);
return null;
}
private Node<K, V>[] resize() {
//copy原数组
Node<K, V>[] oldTab = table;
//原数组的容量
int oldCap = (oldTab == null) ? 0 : oldTab.length;
//上次的扩容阀值
int oldThr = threshold;
//定义新的容量、扩容阀值
int newCap, newThr = 0;
//如果原数组容量大于0
if (oldCap > 0) {
//原数组容量>=最大容量限制,不扩容
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
//如果新容量扩大两倍,小于最大容量限制并且原有的容量>=默认初始容量,阀值扩大两倍
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY && oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1;
}
//构造方法初始化时指定容量,tableSizeFor方法会生成最近的2的幂作为阀值,那么设置容量和阀值一样大
else if (oldThr > 0)
newCap = oldThr;
else {
//初始阀值为0,使用默认值 容量 1<<4
newCap = DEFAULT_INITIAL_CAPACITY;
//阀值 = 容量 * 默认负载因子(0.75)
newThr = (int) (DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
//阀值为零,可能是1、构造方法初始化时指定了容量 2、原容量大于零但是小于默认容量(16)
if (newThr == 0) {
float ft = (float) newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float) MAXIMUM_CAPACITY ?
(int) ft : Integer.MAX_VALUE);
}
threshold = newThr;
@SuppressWarnings({"rawtypes", "unchecked"})
Node<K, V>[] newTab = (Node<K, V>[]) new Node[newCap];
table = newTab;
//原数组不为空,扩容后数据迁移
if (oldTab != null) {
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
if (e.next == null)
//重新计算元素e在新数组的索引位置
newTab[e.hash & (newCap - 1)] = e;
// else if (e instanceof TreeNode)
// ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else {
// 这块是处理链表的情况,
// 需要将此链表拆成两个链表,放到新的数组中,并且保留原来的先后顺序
// loHead、loTail 对应一条链表首尾,hiHead、hiTail 对应另一条链表首尾
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
do {
next = e.next;
//如果索引不变
if ((e.hash & oldCap) == 0) {
if (loTail == null)
loHead = e;
else
loTail.next = e;
loTail = e;
}
else {
if (hiTail == null)
hiHead = e;
else
hiTail.next = e;
hiTail = e;
}
} while ((e = next) != null);
if (loTail != null) {
loTail.next = null;
newTab[j] = loHead;
}
if (hiTail != null) {
hiTail.next = null;
//第二条链表的新的位置是 j + oldCap
newTab[j + oldCap] = hiHead;
}
}
}
}
}
return newTab;
}