多线程环境下操作HashMap的问题

2019独角兽企业重金招聘Python工程师标准>>> 多线程环境下操作HashMap的问题

HashMap为什么不是线程安全，并发操作Hashmap会带来什么问题：
这个问题曾经有一个面试官问过我，当时我天真的以为是读写操作并发时存在脏数据的问题，当时面试官不置可否。我后面回来查资料，发现没有那么简单。并发操作HashMap，是有可能带来死循环以及数据丢失的问题的。

具体情况如下：(以下代码转自美团点评技术团队的文章Java8系列之重新认识HashMap)

情景如下代码:

public class HashMapInfiniteLoop {
private static HashMap<Integer,String> map = new HashMap<Integer,String>(2，0.75f);
public static void main(String[] args) {
map.put(5， "C");
new Thread("Thread1") {
public void run() {
map.put(7, "B");
System.out.println(map);
};
}.start();
new Thread("Thread2") {
public void run() {
map.put(3, "A);
System.out.println(map);
};
}.start();
}
}

其中，map初始化为一个长度为2的数组，loadFactor=0.75，threshold=2*0.75=1，也就是说当put第二个key的时候，map就需要进行扩容。

考虑这样一种情况:
先放出transfer的部分代码：

do {
Entry<K,V> next = e.next; //假设线程一执行到这里就被调度挂起了
int i = indexFor(e.hash, newCapacity);
e.next = newTable[i];
newTable[i] = e;
e = next;
} while (e != null);

线程1、线程2都添加了数据之后，线程1执行到transfer()方法的第一行就被调度挂起了，这时线程2被调度来执行扩容操作。线程2的扩容操作结束之后，线程1被调度回来继续执行，此时由于线程2的执行，e已经指向了线程2修改之后的反转链表，但是线程1并不知道线程2已经在它之前做过这些操作了，于是它继续往下走，此时next=key(7),

然后计算索引。索引计算完之后执行e.next=newTable[i],此时e.next=key(7)。继续往下走，newTable[i]=e,此时newTable[i]=key(3)，再往下，e=next,此时e指向了key(7),本次循环结束。从线程二重组链表结束，到线程1第一轮循环结束的变化图如下:

多线程环境下操作HashMap的问题

一切看起来都还没有什么问题。然后新一轮循环开始

这一轮循环我们不需要走完，就能发现问题。

第一句，执行后为:next=null;

第二句，计算索引，还是i

第三句，在这里就出问题了，这句话执行的是e.next=newTable[i],我们看上图，newTable[i]指向的是key(3),因此出现链表末尾的元素的next指针指向了链表头，循环链表就出现了。（按道理，HashMap是不存在循环链表的。）

第四句话，将链表头的元素换成key(7)，而循环链表依然存在。

第五句，e=null，执行到这循环结束，因为e=null了。

整个过程并不会发生明显的异常。看起来一切安好。顺利的完成了rehash，但是悲剧在后面：当我们调用get（）这个链表中不存在的元素的时候，就会出现死循环。go die

一句话总结就是，并发环境下的rehash过程可能会带来循环链表，导致死循环致使线程挂掉。

因此并发环境下，建议使用Java.util.concurrent包中的ConcurrentHashMap以保证线程安全。

至于HashTable，它并未使用分段锁，而是锁住整个数组，高并发环境下效率非常的低，会导致大量线程等待。
同样的，Synchronized关键字、Lock性能都不如分段锁实现的ConcurrentHashMap。

转载于:https://my.oschina.net/u/1458864/blog/2046327

多线程环境下操作HashMap的问题

相关推荐