深入理解Array、List、Map集合框架底层实现原理

背景:
为什么要做这篇文章呢?本人很讨厌去记冗长的词,更喜欢去理解钻研,发现有趣的事,其实就是大脑海马区水平下降,也叫记忆力不好,初学者看本文需要对数组、集合有一定的了解,任何集合框架都有三大模块:对外的接口、接口的实现和对集合运算的算法。

Arrays

下面创建一个数组

int[] array=new int[10];

下图是在内存上的存储状况
深入理解Array、List、Map集合框架底层实现原理
数组,在内存上给出了连续的空间
缺点

  1. 数据类型定型
  2. 数组定长、大小固定,不适合动态存储,不方便动态添加
  3. 只能通过数组索引去赋值,所以不存在数组插入说法
  4. 不能切确的知道数组内存了多少数据,length只是读取数组长度,这个长度不受数组内容影响

优点

  1. 拥有数组索引,查询速度比链表快

List

Java中的集合框架层次结构
深入理解Array、List、Map集合框架底层实现原理
List接口

public interface List<E> extends Collection<E> 

List存在于java.util,有兴趣的同学可以去阅读jdk1.8Api文档
List接口的特点:
一个有序集合(也被称为序列)。此接口的用户在列表中的每个元素都被插入的地方有精确的控制。用户可以通过它们的整数索引(在列表中的位置)访问元素,并在列表中搜索元素。
与设置不同的是,列表通常允许重复元素。更正式,通常允许列表元素e1和e2这样e1.equals(e2)对,他们通常允许多个null元素是否允许null元素在所有。(引用官方文档的话)

ArrayList

  • 优点:操作读取操作效率高,基于数组实现的,可以为null值,可以允许重复元素,有序,异步。
  • 缺点:由于它是由动态数组实现的,不适合频繁的对元素的插入和删除操作,因为每次插入和删除都需 要移动数组中的元素。

ArrayList底层数据结构
话不多说上源码(主要谈谈add()方法)

/**
     * Shared empty array instance used for default sized empty instances. We
     * distinguish this from EMPTY_ELEMENTDATA to know how much to inflate when
     * first element is added.
     */
    private static final Object[] DEFAULTCAPACITY_EMPTY_ELEMENTDATA = {};
/**
     * Constructs an empty list with an initial capacity of ten.
     */
    public ArrayList() {
        this.elementData = DEFAULTCAPACITY_EMPTY_ELEMENTDATA;
    }

源码可以看出List fruits=new ArrayList();构造一个初始容量为10的空列表。

 public boolean add(E e) {
        ensureCapacityInternal(size + 1);  // Increments modCount!!
        elementData[size++] = e;
        return true;
    }
  

  private void ensureCapacityInternal(int minCapacity) {
        ensureExplicitCapacity(calculateCapacity(elementData, minCapacity));
    }

  private void ensureExplicitCapacity(int minCapacity) {
        modCount++;

        // overflow-conscious code
        if (minCapacity - elementData.length > 0)
            grow(minCapacity);
    }
    
  private static final int MAX_ARRAY_SIZE = Integer.MAX_VALUE - 8;
  
  private void grow(int minCapacity) {
        // overflow-conscious code
        int oldCapacity = elementData.length;
        int newCapacity = oldCapacity + (oldCapacity >> 1);
        if (newCapacity - minCapacity < 0)
            newCapacity = minCapacity;
        if (newCapacity - MAX_ARRAY_SIZE > 0)
            newCapacity = hugeCapacity(minCapacity);
        // minCapacity is usually close to size, so this is a win:
        elementData = Arrays.copyOf(elementData, newCapacity);
    }

读懂这段对于初学者也是毫不费力的,唯一要懂的就是java 的位运算符,’>>‘与’<<’,oldCapacity >> 1表示oldCapacity /2,oldCapacity << 1表示oldCapacity *2,由此可见底层是基于数组改造的,所以数据结构图就是
深入理解Array、List、Map集合框架底层实现原理
(上图若存在侵权请联系作者,谢谢)
如图可见一旦list超过初始容量就会扩大到以前的容量的1.5倍。

上面说过数组是没有真正意义上的插入的,ArrayList虽然底层是数组,但JDK对其做了大量的封装所以拥有随机访问和随意插入的能力
深入理解Array、List、Map集合框架底层实现原理
打印结果:
深入理解Array、List、Map集合框架底层实现原理
当然这里建议大家使用for循环,比较适合数组遍历,foreach适合LinkedList的遍历循环

LinkedList

  • LinkedList是List接口的双向链表非同步实现,并允许包括null在内的所有元素。
  • 底层的数据结构是基于双向链表的,该数据结构我们称为节点
  • 允许所有元素为null
  • 它的查找是分两半查找,先判断index是在链表的哪一半,然后再去对应区域查找,这样最多只要遍历链表的一半节点即可找到(具体找JDK1.8文档)

Map

实现类介绍

  • <K,V> K不能为null,没有意义(机制可以认为K为null),也不能重复,后面讲解Key生成hash值会解释。
  • 一个K只能对应唯一的V,既不能一对多,这个就很符合我国婚姻法了
  • HashMap底层采用数组和链表组合成的数据结构,无序、方法不同步,线程不安全,(翻阅源码可以发现HashMap方法内没标明synchronized关键字)HashMap效率较高,Hashtable效率较低
  • HashTable和HashMap一样,就是方法同步,线程安全
  • TreeMap有序,底层采用红黑树(自平衡的二叉树),线程不安全(ensure)

HashMap使用频繁,重点讲解

/**
     * The default initial capacity - MUST be a power of two.
     * 默认初始容量—必须是2的幂。
     */
    static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

说明初始化容量是16

 static final int MAXIMUM_CAPACITY = 1 << 30;

最大容量是2的30次方

/**
     * The load factor used when none specified in constructor.
     * 构造函数中没有指定时使用的负载因子。
     * 负载因子,当 已使用容量 > 总容量 * 负载因子 时,需要扩容
     */
static final float DEFAULT_LOAD_FACTOR = 0.75f;

 public HashMap() {
        this.loadFactor = DEFAULT_LOAD_FACTOR; // all other fields defaulted
    }

Map<?,?> entity=new HashMap<>();就会调用上述代码,可以发现并没有创建数组,这里只是采用了延迟加载模式,只有put时才会创建一个容量默认的数组,这样就不造成内存浪费,下面是源码

 public V put(K key, V value) {
        return putVal(hash(key), key, value, false, true);
    }
    final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node<K,V>[] tab; Node<K,V> p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node<K,V> e; K k;
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

细心阅读者会发现key是经过hash计算过才存入内存中,内存不可能存在相同的hash值.所以不能有重复的key

HashMap数据结构
第一次put时,首先计算key的hash值
计算这次put要存入数组位置的索引值:index=(数组大小 - 1) & hash
深入理解Array、List、Map集合框架底层实现原理
深入理解Array、List、Map集合框架底层实现原理
大家不要介意图有点烂,主要还是看源码。不断的put就会产生数组不够用和Hash碰撞的问题,数组不够用就会触发扩容,一旦扩容就会产生哈希碰撞,这时链表就派上用场了,HashMap就是通过链表解决哈希冲突的。
深入理解Array、List、Map集合框架底层实现原理
(上图存在侵权请联系作者)

                       **感谢阅读,祝你在程序的世界里越走越远!!**