LinkedHashMap

Page content

简介

先来回顾一下 HashMap 的特性:

① 基于 JDK1.8 的 HashMap 是由数组 + 链表 + 红黑树组成,相对于早期版本的 JDK HashMap 实现,新增了红黑树作为底层数据结构,在数据量较大且哈希碰撞较多时,能够极大的增加检索的效率。

② 允许 key 和 value 都为 null。key 重复会被覆盖,value 允许重复。

③ 非线程安全。

④ 无序(遍历 HashMap 得到元素的顺序不是按照插入的顺序)。

LinkedHashMap 是基于 HashMap 实现的一种集合,具有 HashMap 集合上面所说的所有特点,除了 HashMap 无序的特点,LinkedHashMap 是有序的,因为 LinkedHashMap 在 HashMap 的基础上单独维护了一个具有所有数据的双向链表,该链表保证了元素迭代的顺序。

所以我们可以直接这样说:LinkedHashMap = HashMap + LinkedList。LinkedHashMap 就是在 HashMap 的基础上多维护了一个双向链表,用来保证元素迭代顺序。

1public class LinkedHashMap<K,V> extends HashMap<K,V> implements Map<K,V>

字段属性

Entry<K,V>

1static class Entry<K,V> extends HashMap.Node<K,V> {
2    Entry<K,V> before, after;
3    Entry(int hash, K key, V value, Node<K,V> next) {
4      	super(hash, key, value, next);
5		}
6}

LinkedHashMap 的每个元素都是一个 Entry,我们看到对于 Entry 继承自 HashMap 的 Node 结构,相对于 Node 结构,LinkedHashMap 多了 before 和 after 结构。

下面是Map类集合基本元素的实现演变:

LinkedHashMap 中 Entry 相对于 HashMap 多出的 beforeafter 便是用来维护 LinkedHashMap 插入 Entry 的先后顺序的。

其它属性

用来指向双向链表的头节点:

1transient LinkedHashMap.Entry<K,V> head;

用来指向双向链表的尾节点:

1transient LinkedHashMap.Entry<K,V> tail;

用来指定LinkedHashMap的迭代顺序:

1final boolean accessOrder;
  • true 表示按照访问顺序,会把访问过的元素放在链表后面,放置顺序是访问的顺序;

  • false 表示按照插入顺序遍历。

注意:这里有五个属性别搞混淆:

  • 对于 Node next 属性,是用来维护整个集合中 Entry 的顺序;
  • 对于 Entry beforeEntry after ,以及 Entry headEntry tail,这四个属性都是用来维护保证集合顺序的链表。其中前两个 before 和 after 表示某个节点的上一个节点和下一个节点,这是一个双向链表。后两个属性 head 和 tail 分别表示这个链表的头节点和尾节点。

构造函数

无参构造函数

1public LinkedHashMap() {
2  	super();
3  	accessOrder = false;  //默认按照插入的顺序
4}

指定初始容量

1public LinkedHashMap(int initialCapacity) {
2  	super(initialCapacity);
3		accessOrder = false;
4}

指定初始容量、装载因子

1public LinkedHashMap(int initialCapacity, float loadFactor) {
2  	super(initialCapacity, loadFactor);
3  	accessOrder = false;
4}

指定初始容量、加载因子、迭代规则

1public LinkedHashMap(int initialCapacity, float loadFactor, boolean accessOrder) {
2  	super(initialCapacity, loadFactor);
3  	this.accessOrder = accessOrder;
4}

构造包含指定集合中的元素

1public LinkedHashMap(Map<? extends K, ? extends V> m) {
2		super();
3		accessOrder = false;
4		putMapEntries(m, false);
5}

上面所有的构造函数默认 accessOrder = false,除了第四个构造函数能够指定 accessOrder 的值。

添加元素

LinkedHashMap 中是没有 put 方法的,而是直接调用父类 HashMap 的 put 方法。关于 HashMap 的 put 方法,可以参看 HashMap 的介绍

LinkedHashMap

1public V put(K key, V value) {
2		return putVal(hash(key), key, value, false, true);
3}

HashMap

 1public V put(K key, V value) {
 2		return putVal(hash(key), key, value, false, true);
 3}
 4
 5/**
 6 * @param hash         索引的位置
 7 * @param key          键
 8 * @param value        值
 9 * @param onlyIfAbsent true 表示不要更改现有值
10 * @param evict        false 表示table处于创建模式
11 * @return
12 */
13final V putVal(int hash, K key, V value, boolean onlyIfAbsent, boolean evict) {
14    Node<K,V>[] tab; 
15  	Node<K,V> p; 
16  	int n, i;
17  	//如果table为null或者长度为0,则进行初始化
18		//resize()方法本来是用于扩容,由于初始化没有实际分配空间,这里用该方法进行空间分配,后面会详细讲解该方法
19    if ((tab = table) == null || (n = tab.length) == 0)
20      	n = (tab = resize()).length;
21  	//注意:这里用到了前面讲解获得key的hash码的第三步,取模运算,下面的if-else分别是 tab[i] 为null和不为null
22    if ((p = tab[i = (n - 1) & hash]) == null)
23      	tab[i] = newNode(hash, key, value, null); //tab[i] 为null,直接将新的key-value插入到计算的索引i位置   ①
24    else {  //tab[i] 不为null,表示该位置已经有值了
25      	Node<K,V> e; K k;
26        if (p.hash == hash &&
27            ((k = p.key) == key || (key != null && key.equals(k))))
28          	e = p;   //节点key已经有值了,直接用新值覆盖
29        //该链是红黑树
30      	else if (p instanceof TreeNode)
31          	e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);  // ②
32        //该链是链表
33      	else {
34            for (int binCount = 0; ; ++binCount) {
35                if ((e = p.next) == null) {
36                    p.next = newNode(hash, key, value, null);
37                    //链表长度大于8,转换成红黑树
38                  	if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
39                      	treeifyBin(tab, hash);
40                  	break;
41                }
42              	//key已经存在直接覆盖value
43                if (e.hash == hash &&
44                    ((k = e.key) == key || (key != null && key.equals(k))))
45                  	break;
46                p = e;
47            }
48        }
49        if (e != null) { // existing mapping for key
50            V oldValue = e.value;
51            if (!onlyIfAbsent || oldValue == null)
52              	e.value = value;
53            afterNodeAccess(e);  // ③ 
54            return oldValue;
55        }
56    }
57    ++modCount; //用作修改和新增快速失败
58    if (++size > threshold) resize(); //超过最大容量,进行扩容
59    afterNodeInsertion(evict);   // ④ 
60    return null;
61}

这里主要介绍上面方法中,为了保证 LinkedHashMap 的迭代顺序,在添加元素时重写了的4个方法,分别位于① ② ③ ④ 处

1newNode(hash, key, value, null);  // ①
2putTreeVal(this, tab, hash, key, value)  // ② newTreeNode(h, k, v, xpn)  
3afterNodeAccess(e);  // ③ 
4afterNodeInsertion(evict);  // ④ 

① 对于 newNode(hash, key, value, null) 方法

 1HashMap.Node<K,V> newNode(int hash, K key, V value, HashMap.Node<K,V> e) {
 2		LinkedHashMap.Entry<K,V> p = new LinkedHashMap.Entry<K,V>(hash, key, value, e);
 3		linkNodeLast(p);
 4		return p;
 5}
 6
 7private void linkNodeLast(LinkedHashMap.Entry<K,V> p) {
 8    //用临时变量last记录尾节点tail
 9    LinkedHashMap.Entry<K,V> last = tail;
10    //将尾节点设为当前插入的节点p
11    tail = p;
12    //如果原先尾节点为null,表示当前链表为空
13    if (last == null)
14        //头结点也为当前插入节点
15        head = p;
16    else {
17        //原始链表不为空,那么将当前节点的上节点指向原始尾节点
18        p.before = last;
19        //原始尾节点的下一个节点指向当前插入节点
20        last.after = p;
21    }
22}

② 对于 putTreeVal 方法

是在添加红黑树节点时的操作,LinkedHashMap 也重写了该方法的 newTreeNode 方法:

1TreeNode<K,V> newTreeNode(int hash, K key, V value, Node<K,V> next) {
2		TreeNode<K,V> p = new TreeNode<K,V>(hash, key, value, next);
3		linkNodeLast(p);
4		return p;
5}

也就是说上面两个方法都是在将新添加的元素放置到链表的尾端,并维护链表节点之间的关系。 

③ 对于 afterNodeAccess(e) 方法

在 putVal 方法中,是当添加数据键值对的 key 存在时,会对 value 进行替换。然后调用 afterNodeAccess(e) 方法:

 1//把当前节点放到双向链表的尾部
 2void afterNodeAccess(HashMap.Node<K,V> e) { // move node to last
 3    LinkedHashMap.Entry<K,V> last;
 4    //当 accessOrder = true 并且当前节点不等于尾节点tail。这里将last节点赋值为tail节点
 5    if (accessOrder && (last = tail) != e) {
 6        //记录当前节点的上一个节点b和下一个节点a
 7       LinkedHashMap.Entry<K,V> p =
 8               (LinkedHashMap.Entry<K,V>)e, b = p.before, a = p.after;
 9       //释放当前节点和后一个节点的关系
10       p.after = null;
11       //如果当前节点的前一个节点为null
12       if (b == null)
13           //头节点=当前节点的下一个节点
14           head = a;
15       else
16           //否则b的后节点指向a
17           b.after = a;
18       //如果a != null
19       if (a != null)
20           //a的前一个节点指向b
21           a.before = b;
22       else
23           //b设为尾节点
24           last = b;
25       //如果尾节点为null
26       if (last == null)
27           //头节点设为p
28           head = p;
29       else {
30           //否则将p放到双向链表的最后
31           p.before = last;
32           last.after = p;
33       }
34       //将尾节点设为p
35       tail = p;
36       //LinkedHashMap对象操作次数+1,用于快速失败校验
37       ++modCount;
38		}
39}

该方法是在 accessOrder = true 并且插入的当前节点不等于尾节点时,该方法才会生效。并且该方法的作用是将插入的节点变为尾节点,后面在 get 方法中也会调用。代码实现可能有点绕,可以借助下图来理解:

④ 再看 afterNodeInsertion(evict) 方法

1void afterNodeInsertion(boolean evict) { // possibly remove eldest
2    LinkedHashMap.Entry<K,V> first;
3    if (evict && (first = head) != null && removeEldestEntry(first)) {
4        K key = first.key;
5        removeNode(hash(key), key, null, false, true);
6    }
7}

该方法用来移除最老的首节点,首先方法要能执行到if语句里面,必须 evict = true,且头节点不为null,并且 removeEldestEntry(first) 返回true,这三个条件必须同时满足,前面两个好理解,我们看最后这个方法条件:

1protected boolean removeEldestEntry(Map.Entry<K,V> eldest) {
2    return false;
3}

这就奇怪了,该方法直接返回的是 false,也就是说怎么都不会进入到 if 方法体内了,那这是这么回事呢?

这其实是用来实现 LRU(Least Recently Used,最近最少使用)Cache 时,重写的一个方法。比如在 mybatis-connector 包中,有这样一个类:

 1package com.mysql.jdbc.util;
 2
 3import java.util.LinkedHashMap;
 4import java.util.Map.Entry;
 5
 6public class LRUCache<K, V> extends LinkedHashMap<K, V> {
 7    private static final long serialVersionUID = 1L;
 8    protected int maxElements;
 9
10    public LRUCache(int maxSize) {
11        super(maxSize, 0.75F, true);
12        this.maxElements = maxSize;
13    }
14
15    protected boolean removeEldestEntry(Entry<K, V> eldest) {
16        return this.size() > this.maxElements;
17    }
18}

可以看到,它重写了 removeEldestEntry(Entry<K,V> eldest) 方法,当元素的个数大于设定的最大个数,便移除首元素。

删除元素

同理也是调用 HashMap 的remove 方法,这里不作过多的讲解,着重看 LinkedHashMap 重写的 ① 方法。

 1final Node<K,V> removeNode(int hash, Object key, Object value,
 2                           boolean matchValue, boolean movable) {
 3    Node<K,V>[] tab; Node<K,V> p; int n, index;
 4  	//(n - 1) & hash找到桶的位置
 5    if ((tab = table) != null && (n = tab.length) > 0 &&
 6        (p = tab[index = (n - 1) & hash]) != null) {
 7        Node<K,V> node = null, e; K k; V v;
 8      	
 9      	//如果键的值与链表第一个节点相等,则将 node 指向该节点
10        if (p.hash == hash &&
11            ((k = p.key) == key || (key != null && key.equals(k))))
12            node = p;
13      	//如果桶节点存在下一个节点
14        else if ((e = p.next) != null) {
15          	//节点为红黑树
16            if (p instanceof TreeNode)
17                node = ((TreeNode<K,V>)p).getTreeNode(hash, key); //找到需要删除的红黑树节点
18            else {
19                do {  //遍历链表,找到待删除的节点
20                    if (e.hash == hash &&
21                        ((k = e.key) == key ||
22                         (key != null && key.equals(k)))) {
23                        node = e;
24                        break;
25                    }
26                    p = e;
27                } while ((e = e.next) != null);
28            }
29        }
30      	
31      	//删除节点,并进行调节红黑树平衡
32        if (node != null && (!matchValue || (v = node.value) == value ||
33                             (value != null && value.equals(v)))) {
34            if (node instanceof TreeNode)
35                ((TreeNode<K,V>)node).removeTreeNode(this, tab, movable);
36            else if (node == p)
37                tab[index] = node.next;
38            else
39                p.next = node.next;
40            ++modCount;
41            --size;
42            afterNodeRemoval(node); // ①
43            return node;
44        }
45    }
46    return null;
47}

我们看 ① 代码实现:

 1void afterNodeRemoval(HashMap.Node<K,V> e) { // unlink
 2    LinkedHashMap.Entry<K,V> p =
 3            (LinkedHashMap.Entry<K,V>)e, b = p.before, a = p.after;
 4    p.before = p.after = null;
 5    if (b == null)
 6        head = a;
 7    else
 8        b.after = a;
 9    if (a == null)
10        tail = b;
11    else
12        a.before = b;
13}

该方法其实很好理解,就是当我们删除某个节点时,为了保证链表还是有序的,那么必须维护其前后节点。而该方法的作用就是维护删除节点的前后节点关系。

查找元素

1public V get(Object key) {
2    Node<K,V> e;
3    if ((e = getNode(hash(key), key)) == null)
4        return null;
5    if (accessOrder)
6        afterNodeAccess(e);
7    return e.value;
8}

相比于 HashMap 的 get 方法,这里多出了第 5,6行代码,当 accessOrder = true 时,即表示按照最近访问的迭代顺序,会将访问过的元素放在链表后面。

对于 afterNodeAccess(e) 方法,在前面第 4 小节 添加元素已经介绍过了,这就不再介绍。

遍历元素

在介绍 HashMap 时,我们介绍了 4 中遍历方式,同理,对于 LinkedHashMap 也有 4 种,这里我们介绍效率较高的两种遍历方式:

  1. 得到 Entry 集合,然后遍历 Entry
1LinkedHashMap<String,String> map = new LinkedHashMap<>();
2map.put("A","1");
3map.put("B","2");
4map.put("C","3");
5map.get("B");
6Set<Map.Entry<String,String>> entrySet = map.entrySet();
7for(Map.Entry<String,String> entry : entrySet ){
8    System.out.println(entry.getKey()+"---"+entry.getValue());
9}
  1. 迭代
1Iterator<Map.Entry<String,String>> iterator = map.entrySet().iterator();
2while(iterator.hasNext()){
3    Map.Entry<String,String> entry = iterator.next();
4    System.out.println(entry.getKey()+"----"+entry.getValue());
5}

这两种效率都还不错,通过迭代的方式可以对一边遍历一边删除元素,而第一种删除元素会报错。

打印结果:

1A---1
2B---2
3C---3
4A---1
5B---2
6C---3

迭代器

我们把上面遍历的LinkedHashMap 构造函数改成下面的:

1LinkedHashMap<String,String> map = new LinkedHashMap<>(16,0.75F,true);

也就是说将 accessOrder = true,表示按照访问顺序来遍历,注意看上面的 第 5 行代码:map.get("B")。也就是说设置 accessOrder = true 之后,那么 B—2 应该是最后输出,我们看一下打印结果:

1A---1
2C---3
3B---2

结果跟预期一致。那么在遍历的过程中,LinkedHashMap 是如何进行的呢?

我们追溯源码:首先进入到 map.entrySet() 方法里面:

1public Set<Map.Entry<K,V>> entrySet() {
2    Set<Map.Entry<K,V>> es;
3    return (es = entrySet) == null ? (entrySet = new LinkedEntrySet()) : es;
4}

发现 entrySet = new LinkedEntrySet() ,接下来我们查看 LinkedEntrySet 类。

1final class LinkedEntrySet extends AbstractSet<Map.Entry<K,V>> {
2    public final int size()                 { return size; }
3    public final void clear()               { LinkedHashMap.this.clear(); }
4    public final Iterator<Map.Entry<K,V>> iterator() {
5        return new LinkedEntryIterator();
6    }
7  ...
8}

这是一个内部类,我们查看其 iterator() 方法,发现又new 了一个新对象 LinkedEntryIterator,接着看这个类:

1final class LinkedEntryIterator extends LinkedHashIterator
2    implements Iterator<Map.Entry<K,V>> {
3    public final Map.Entry<K,V> next() { return nextNode(); }
4}

这个类继承 LinkedHashIterator。

 1abstract class LinkedHashIterator {
 2    LinkedHashMap.Entry<K,V> next;
 3    LinkedHashMap.Entry<K,V> current;
 4    int expectedModCount;
 5
 6    LinkedHashIterator() {
 7        next = head;
 8        expectedModCount = modCount;
 9        current = null;
10    }
11
12    public final boolean hasNext() {
13        return next != null;
14    }
15
16    final LinkedHashMap.Entry<K,V> nextNode() {
17        LinkedHashMap.Entry<K,V> e = next;
18        if (modCount != expectedModCount)
19            throw new ConcurrentModificationException();
20        if (e == null)
21            throw new NoSuchElementException();
22        current = e;
23        next = e.after;
24        return e;
25    }
26
27    public final void remove() {
28        Node<K,V> p = current;
29        if (p == null)
30            throw new IllegalStateException();
31        if (modCount != expectedModCount)
32            throw new ConcurrentModificationException();
33        current = null;
34        K key = p.key;
35        removeNode(hash(key), key, null, false, false);
36        expectedModCount = modCount;
37    }
38}

看到 nextNode() 方法,很显然是通过遍历链表的方式来遍历整个 LinkedHashMap 。