1
0
mirror of https://github.com/Snailclimb/JavaGuide synced 2025-06-16 18:10:13 +08:00

[docs update]完善LinkedHashMap源码分析并同步到网站

This commit is contained in:
Guide 2023-07-12 11:11:03 +08:00
parent 3ff0f75eff
commit e680941f43
6 changed files with 289 additions and 428 deletions

View File

@ -70,6 +70,7 @@
- [LinkedList 核心源码分析](./docs/java/collection/linkedlist-source-code.md) - [LinkedList 核心源码分析](./docs/java/collection/linkedlist-source-code.md)
- [HashMap 核心源码+底层数据结构分析](./docs/java/collection/hashmap-source-code.md) - [HashMap 核心源码+底层数据结构分析](./docs/java/collection/hashmap-source-code.md)
- [ConcurrentHashMap 核心源码+底层数据结构分析](./docs/java/collection/concurrent-hash-map-source-code.md) - [ConcurrentHashMap 核心源码+底层数据结构分析](./docs/java/collection/concurrent-hash-map-source-code.md)
- [LinkedHashMap 核心源码分析](./docs/java/collection/linkedhashmap-source-code.md)
- [CopyOnWriteArrayList 核心源码分析](./docs/java/collection/copyonwritearraylist-source-code.md) - [CopyOnWriteArrayList 核心源码分析](./docs/java/collection/copyonwritearraylist-source-code.md)
- [ArrayBlockingQueue 核心源码分析](./docs/java/collection/arrayblockingqueue-source-code.md) - [ArrayBlockingQueue 核心源码分析](./docs/java/collection/arrayblockingqueue-source-code.md)
- [PriorityQueue 核心源码分析](./docs/java/collection/priorityqueue-source-code.md) - [PriorityQueue 核心源码分析](./docs/java/collection/priorityqueue-source-code.md)

View File

@ -89,6 +89,7 @@ export default sidebar({
"linkedlist-source-code", "linkedlist-source-code",
"hashmap-source-code", "hashmap-source-code",
"concurrent-hash-map-source-code", "concurrent-hash-map-source-code",
"linkedhashmap-source-code",
"copyonwritearraylist-source-code", "copyonwritearraylist-source-code",
"arrayblockingqueue-source-code", "arrayblockingqueue-source-code",
"priorityqueue-source-code" "priorityqueue-source-code"

View File

@ -358,6 +358,8 @@ SELECT sql_no_cache COUNT(*) FROM usr;
## MySQL 日志 ## MySQL 日志
MySQL 日志常见的面试题有:
- MySQL 中常见的日志有哪些? - MySQL 中常见的日志有哪些?
- 慢查询日志有什么用? - 慢查询日志有什么用?
- binlog 主要记录了什么? - binlog 主要记录了什么?

View File

@ -64,6 +64,7 @@ title: JavaGuideJava学习&面试指南)
- [LinkedList 核心源码分析](./java/collection/linkedlist-source-code.md) - [LinkedList 核心源码分析](./java/collection/linkedlist-source-code.md)
- [HashMap 核心源码+底层数据结构分析](./java/collection/hashmap-source-code.md) - [HashMap 核心源码+底层数据结构分析](./java/collection/hashmap-source-code.md)
- [ConcurrentHashMap 核心源码+底层数据结构分析](./java/collection/concurrent-hash-map-source-code.md) - [ConcurrentHashMap 核心源码+底层数据结构分析](./java/collection/concurrent-hash-map-source-code.md)
- [LinkedHashMap 核心源码分析](./java/collection/linkedhashmap-source-code.md)
- [CopyOnWriteArrayList 核心源码分析](./java/collection/copyonwritearraylist-source-code.md) - [CopyOnWriteArrayList 核心源码分析](./java/collection/copyonwritearraylist-source-code.md)
- [ArrayBlockingQueue 核心源码分析](./java/collection/arrayblockingqueue-source-code.md) - [ArrayBlockingQueue 核心源码分析](./java/collection/arrayblockingqueue-source-code.md)

View File

@ -1,93 +1,96 @@
---
title: LinkedHashMap 源码分析
category: Java
tag:
- Java集合
---
## LinkedHashMap 简介 ## LinkedHashMap 简介
`LinkedHashMap` 是 Java 提供的一个集合类,它继承自 `HashMap`,并在 `HashMap` 基础上维护一条双向链表,使得具备如下特性: `LinkedHashMap` 是 Java 提供的一个集合类,它继承自 `HashMap`,并在 `HashMap` 基础上维护一条双向链表,使得具备如下特性:
1. 支持遍历时会按照插入顺序有序进行迭代。 1. 支持遍历时会按照插入顺序有序进行迭代。
2. 支持按照元素访问顺序排序,适用于封装 LRU 缓存工具。 2. 支持按照元素访问顺序排序,适用于封装 LRU 缓存工具。
3. 因为内部使用双向链表维护各个节点,所以遍历时的效率和元素个数成正比,相较于和容量成正比的 HashMap 来说,迭代效率会高很多。 3. 因为内部使用双向链表维护各个节点,所以遍历时的效率和元素个数成正比,相较于和容量成正比的 HashMap 来说,迭代效率会高很多。
`LinkedHashMap`逻辑结构如下图所示它是在HashMap基础上在各个节点之间维护一条双向链表使得原本散列在不同`bucket`上的节点、链表、红黑树有序关联起来。 `LinkedHashMap` 逻辑结构如下图所示,它是在 `HashMap` 基础上在各个节点之间维护一条双向链表,使得原本散列在不同 bucket 上的节点、链表、红黑树有序关联起来。
![在这里插入图片描述](https://qiniuyun.sharkchili.com/202307112055203.png)
![LinkedHashMap 逻辑结构](https://oss.javaguide.cn/github/javaguide/java/collection/linkhashmap-structure-overview.png)
## LinkedHashMap 使用示例 ## LinkedHashMap 使用示例
### 顺序遍历 ### 插入顺序遍历
如下所示,我们按照顺序往 `LinkedHashMap` 添加元素然后进行遍历。 如下所示,我们按照顺序往 `LinkedHashMap` 添加元素然后进行遍历。
```java ```java
HashMap < String, String > map = new LinkedHashMap < > (); HashMap < String, String > map = new LinkedHashMap < > ();
map.put("a", "2"); map.put("a", "2");
map.put("g", "3"); map.put("g", "3");
map.put("r", "1"); map.put("r", "1");
map.put("e", "23"); map.put("e", "23");
map.put("h","54");
map.put("j","22");
for (Map.Entry < String, String > entry: map.entrySet()) { for (Map.Entry < String, String > entry: map.entrySet()) {
System.out.println(entry.getKey() + ":" + entry.getValue()); System.out.println(entry.getKey() + ":" + entry.getValue());
} }
``` ```
输出结果如下,可以看出,LinkedHashMap的迭代顺序是和插入顺序一致的,这一点是HashMap所不具备的。 输出
```java ```java
a:2 a:2
g:3 g:3
r:1 r:1
e:23 e:23
h:54
j:22
``` ```
可以看出,`LinkedHashMap` 的迭代顺序是和插入顺序一致的,这一点是 `HashMap` 所不具备的。
### 最近最少访问优先 ### 访问顺序遍历
再来看看这段代码,我们将`accessOrder`设置为true使之具备访问有序性随后我们顺序插入key为1、2、3的键值对再访问一次key为2的键值对。
`LinkedHashMap` 定义了排序模式 `accessOrder`(boolean 类型,默认为 false),访问顺序则为 true插入顺序则为 false。
为了实现访问顺序遍历,我们可以使用传入 `accessOrder` 属性的 `LinkedHashMap` 构造方法,并将 `accessOrder` 设置为 true表示其具备访问有序性。
```java ```java
LinkedHashMap<Integer, String> map = new LinkedHashMap<>(16, 0.75f, true); LinkedHashMap<Integer, String> map = new LinkedHashMap<>(16, 0.75f, true);
map.put(1, "one"); map.put(1, "one");
map.put(2, "two"); map.put(2, "two");
map.put(3, "three"); map.put(3, "three");
map.put(4, "four");
System.out.println(map.get(2)); // 访问元素2元素2会被移动到链表末端 map.put(5, "five");
//访问元素2,该元素会被移动至链表末端
map.get(2);
//访问元素3,该元素会被移动至链表末端
map.get(3);
for (Map.Entry<Integer, String> entry : map.entrySet()) { for (Map.Entry<Integer, String> entry : map.entrySet()) {
System.out.println(entry.getKey() + " : " + entry.getValue()); System.out.println(entry.getKey() + " : " + entry.getValue());
} }
``` ```
从输出结果来看,将`accessOrder`设置为true的`LinkedHashMap`排序时会按照最近最少访问(LRU)进行元素迭代所以当我们访问key为2的键值对之后该键值对就会被移动至链表末端所以迭代顺序才变为1、3、2。 输出:
```java ```java
two
1 : one 1 : one
3 : three 4 : four
5 : five
2 : two 2 : two
3 : three
``` ```
可以看出,`LinkedHashMap` 的迭代顺序是和访问顺序一致的。
### LRU 缓存 ### LRU 缓存
从上一个我们可以了解到通过`LinkedHashMap`我们可以封装一个LRU缓存确保当存放的元素超过容器容量时将最近最少访问的元素移除。 从上一个我们可以了解到通过 `LinkedHashMap` 我们可以封装一个简易版的 LRU**L**east **R**ecently **U**sed最近最少使用 缓存,确保当存放的元素超过容器容量时,将最近最少访问的元素移除。
![](https://oss.javaguide.cn/github/javaguide/java/collection/lru-cache.png)
具体实现思路如下:
- 继承 `LinkedHashMap`;
![在这里插入图片描述](https://qiniuyun.sharkchili.com/202307112055374.png) - 构造方法中指定 `accessOrder` 为 true ,这样在访问元素时就会把该元素移动到链表尾部,链表首元素就是最近最少被访问的元素;
- 重写`removeEldestEntry` 方法,该方法会返回一个 boolean 值,告知 `LinkedHashMap` 是否需要移除链表首元素(缓存容量有限)。
代码如下所示,可以看到笔者封装了一个`LRUCache`并继承`LinkedHashMap`,构造函数初始化容量之后,将`accessOrder`设置为true。并且笔者重写了removeEldestEntry方法该方法会返回一个boolean值告知`LinkedHashMap`是否需要移除链表首元素,因为我们将`accessOrder`设置为true所以首元素就是最近最少访问的元素由此我们的LRU缓存就封装完成了。
```java ```java
public class LRUCache<K, V> extends LinkedHashMap<K, V> { public class LRUCache<K, V> extends LinkedHashMap<K, V> {
@ -99,40 +102,28 @@ public class LRUCache<K, V> extends LinkedHashMap<K, V> {
} }
/** /**
* 判断size超过容量时返回true告知LinkedHashMap移除最近最少访问的元素(即链表的第一个元素) * 判断size超过容量时返回true告知LinkedHashMap移除最老的缓存项(即链表的第一个元素)
* @param eldest
* @return
*/ */
@Override
protected boolean removeEldestEntry(Map.Entry<K, V> eldest) { protected boolean removeEldestEntry(Map.Entry<K, V> eldest) {
return size() > capacity; return size() > capacity;
} }
} }
``` ```
测试代码如下,笔者初始化缓存容量为 2然后按照次序先后添加 4 个元素。 测试代码如下,笔者初始化缓存容量为 2然后按照次序先后添加 4 个元素。
```java ```java
public static void main(String[] args) {
LRUCache < Integer, String > cache = new LRUCache < > (2); LRUCache < Integer, String > cache = new LRUCache < > (2);
cache.put(1, "one"); cache.put(1, "one");
cache.put(2, "two"); cache.put(2, "two");
cache.put(3, "three"); cache.put(3, "three");
for (int i = 0; i < 4; i++) {
System.out.println(cache.get(1)); // 输出null System.out.println(cache.get(i));
cache.put(4, "four");
System.out.println(cache.get(2)); // 输出null
System.out.println(cache.get(3)); // 输出"three"
} }
``` ```
从输出结果来看添加3时因为缓存size为2于是将key为1的键值对删除了所以第一次输出为null。同理我们再次添加4size超过了容量大小将2移除所以输出的key为2的键值对为null而键值对为3的输出结果为three。 输出:
```java ```java
null null
@ -140,8 +131,9 @@ null
three three
``` ```
## LinkedHashMap源码解析 从输出结果来看,由于缓存容量为 2 ,因此,添加第 3 个元素时,第 1 个元素会被删除。添加第 4 个元素时,第 2 个元素会被删除。
## LinkedHashMap 源码解析
### Node 的设计 ### Node 的设计
@ -150,30 +142,24 @@ three
1. 链表上的节点个数达到树化的阈值-1`TREEIFY_THRESHOLD - 1` 1. 链表上的节点个数达到树化的阈值-1`TREEIFY_THRESHOLD - 1`
2. bucket 的容量达到最小的树化容量即`MIN_TREEIFY_CAPACITY` 2. bucket 的容量达到最小的树化容量即`MIN_TREEIFY_CAPACITY`
`LinkedHashMap` 是在 `HashMap` 的基础上为 bucket 上的每一个节点建立一条双向链表,这就使得转为红黑树的树节点也需要具备双向链表节点的特性,即每一个树节点都需要拥有两个引用存储前驱节点和后继节点的地址,所以对于树节点类 `TreeNode` 的设计就是一个比较棘手的问题。 `LinkedHashMap` 是在 `HashMap` 的基础上为 bucket 上的每一个节点建立一条双向链表,这就使得转为红黑树的树节点也需要具备双向链表节点的特性,即每一个树节点都需要拥有两个引用存储前驱节点和后继节点的地址,所以对于树节点类 `TreeNode` 的设计就是一个比较棘手的问题。
对此我们不妨来看看两者之间节点类的类图,可以看到: 对此我们不妨来看看两者之间节点类的类图,可以看到:
1. `LinkedHashMap`的节点内部类`Entry`基于`HashMap`的基础上增加before和after指针使节点具备双向链表的特性。
1. `LinkedHashMap` 的节点内部类 `Entry` 基于 `HashMap` 的基础上,增加 `before``after` 指针使节点具备双向链表的特性。
2. `HashMap` 的树节点 `TreeNode` 继承了具备双向链表特性的 `LinkedHashMap``Entry` 2. `HashMap` 的树节点 `TreeNode` 继承了具备双向链表特性的 `LinkedHashMap``Entry`
![LinkedHashMap 和 HashMap 之间的关系](https://oss.javaguide.cn/github/javaguide/java/collection/map-hashmap-linkedhashmap.png)
![在这里插入图片描述](https://qiniuyun.sharkchili.com/202307112055375.png)
很多读者此时就会有这样一个疑问,为什么 `HashMap` 的树节点 `TreeNode` 要通过 `LinkedHashMap` 获取双向链表的特性呢?为什么不直接在 `Node` 上实现前驱和后继指针呢? 很多读者此时就会有这样一个疑问,为什么 `HashMap` 的树节点 `TreeNode` 要通过 `LinkedHashMap` 获取双向链表的特性呢?为什么不直接在 `Node` 上实现前驱和后继指针呢?
先来回答第一个问题,我们都知道 `LinkedHashMap` 是在 `HashMap` 基础上对节点增加双向指针实现双向链表的特性,所以 `LinkedHashMap` 内部链表转红黑树时,对应的节点会转为树节点 `TreeNode`,为了保证使用 `LinkedHashMap` 时树节点具备双向链表的特性,所以树节点 `TreeNode` 需要继承 `LinkedHashMap``Entry`
先来回答第一个问题,我们都知道`LinkedHashMap`是在`HashMap`基础上对节点增加双向指针实现双向链表的特性,所以`LinkedHashMap`内部链表转红黑树时,对应的节点会转为树节点`TreeNode`,为了保证使用`LinkedHashMap`时树节点具备双向链表的特性,所以树节点`TreeNode`需要继承`LinkedHashMap``Entry`
再来说说第二个问题,我们直接在 `HashMap` 的节点 `Node` 上直接实现前驱和后继指针,然后 `TreeNode` 直接继承 `Node` 获取双向链表的特性为什么不行呢?其实这样做也是可以的。只不过这种做法会使得使用 `HashMap` 时存储键值对的节点类 `Node` 多了两个没有必要的引用,占用没必要的内存空间。 再来说说第二个问题,我们直接在 `HashMap` 的节点 `Node` 上直接实现前驱和后继指针,然后 `TreeNode` 直接继承 `Node` 获取双向链表的特性为什么不行呢?其实这样做也是可以的。只不过这种做法会使得使用 `HashMap` 时存储键值对的节点类 `Node` 多了两个没有必要的引用,占用没必要的内存空间。
所以为了保证`HashMap`底层的节点类`Node`没有多余的引用,又要保证`LinkedHashMap`的节点类Entry拥有存储链表的引用设计者就让`LinkedHashMap`的节点`Entry`去继承`Node`并增加存储前驱后继节点的引用`before``after`,让需要用到链表特性的节点去实现需要的逻辑。然后树节点`TreeNode`再通过继承`Entry`获取`before``after`两个指针。 所以,为了保证 `HashMap` 底层的节点类 `Node` 没有多余的引用,又要保证 `LinkedHashMap` 的节点类 `Entry` 拥有存储链表的引用,设计者就让 `LinkedHashMap` 的节点 `Entry` 去继承 Node 并增加存储前驱后继节点的引用 `before``after`,让需要用到链表特性的节点去实现需要的逻辑。然后树节点 `TreeNode` 再通过继承 `Entry` 获取 `before``after` 两个指针。
```bash ```java
static class Entry<K,V> extends HashMap.Node<K,V> { static class Entry<K,V> extends HashMap.Node<K,V> {
Entry<K,V> before, after; Entry<K,V> before, after;
Entry(int hash, K key, V value, Node<K,V> next) { Entry(int hash, K key, V value, Node<K,V> next) {
@ -182,21 +168,17 @@ static class Entry<K,V> extends HashMap.Node<K,V> {
} }
``` ```
但是这样做,不也使得使用 `HashMap` 时的 `TreeNode` 多了两个没有必要的引用吗?这不也是一种空间的浪费吗? 但是这样做,不也使得使用 `HashMap` 时的 `TreeNode` 多了两个没有必要的引用吗?这不也是一种空间的浪费吗?
```java
```bash
static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> { static final class TreeNode<K,V> extends LinkedHashMap.Entry<K,V> {
//略 //略
} }
``` ```
对于这个问题,引用作者的一段注释,作者们认为在良好的 `hashCode` 算法时,`HashMap` 转红黑树的概率不大。就算转为红黑树变为树节点,也可能会因为移除或者扩容将 `TreeNode` 变为 `Node`,所以 `TreeNode` 的使用概率不算很大,对于这一点资源空间的浪费是可以接受的。 对于这个问题,引用作者的一段注释,作者们认为在良好的 `hashCode` 算法时,`HashMap` 转红黑树的概率不大。就算转为红黑树变为树节点,也可能会因为移除或者扩容将 `TreeNode` 变为 `Node`,所以 `TreeNode` 的使用概率不算很大,对于这一点资源空间的浪费是可以接受的。
```bash ```bash
Because TreeNodes are about twice the size of regular nodes, we Because TreeNodes are about twice the size of regular nodes, we
use them only when bins contain enough nodes to warrant use use them only when bins contain enough nodes to warrant use
@ -207,19 +189,16 @@ rarely used. Ideally, under random hashCodes, the frequency of
nodes in bins follows a Poisson distribution nodes in bins follows a Poisson distribution
``` ```
### 构造方法 ### 构造方法
`LinkedHashMap` 构造方法有 4 个实现也比较简单,直接调用父类即 `HashMap` 的构造方法完成初始化。
`LinkedHashMap`构造方法有4个实现也比较简单直接调用父类即`HashMap`的构造方法完成初始化在设置accessOrder ,默认情况下`accessOrder` 为false所以假如我们若要`LinkedHashMap`实现键值对按照访问顺序排序(即将最近最少访问的元素排在链表首部、最近访问的元素移动到链表尾部)需要调用第4个构造方法将`accessOrder` 设置为true。 ```java
```bash
public LinkedHashMap() { public LinkedHashMap() {
super(); super();
accessOrder = false; accessOrder = false;
} }
public LinkedHashMap(int initialCapacity) { public LinkedHashMap(int initialCapacity) {
super(initialCapacity); super(initialCapacity);
accessOrder = false; accessOrder = false;
@ -238,56 +217,11 @@ public LinkedHashMap(int initialCapacity,
} }
``` ```
我们上面也提到了,默认情况下 `accessOrder` 为 false如果我们要让 `LinkedHashMap` 实现键值对按照访问顺序排序(即将最近未访问的元素排在链表首部、最近访问的元素移动到链表尾部),需要调用第 4 个构造方法将 `accessOrder` 设置为 true。
### get 方法 ### get 方法
`get`方法是`LinkedHashMap`增删改查操作中唯一一个重写的方法,它会在元素查询完成之后,将当前访问的元素移到链表的末尾。 `get` 方法是 `LinkedHashMap` 增删改查操作中唯一一个重写的方法, `accessOrder` 为 true 的情况下, 它会在元素查询完成之后,将当前访问的元素移到链表的末尾。
我们就以下面这张图为例我们的双向链表指向前驱节点的指针为红色指向后继节点的指针为蓝色演示一下访问key为13(后文统称为13)的元素后`LinkedHashMap`的如何将其移动至链表尾部。
![在这里插入图片描述](https://qiniuyun.sharkchili.com/202307112055883.png)
当我们访问`LinkedHashMap`中key为13的元素时双向链表首先会将13的后继指针指向null,所以笔者这里索性将指针删除。
![在这里插入图片描述](https://qiniuyun.sharkchili.com/202307112055476.png)
随后查看13是否有前驱节点发现其前驱节点是一个key为11的节点故让11直接指向13的后继节点25。
![在这里插入图片描述](https://qiniuyun.sharkchili.com/202307112055529.png)
同理如果13的后继节点不为空也让其指向13的前驱节点所以25的前驱指针指向11。
![在这里插入图片描述](https://qiniuyun.sharkchili.com/202307112055430.png)
回到13节点如果它发现双向链表存在尾节点则将自己的前驱指针指向尾节点而尾节点也会将前驱指针指向13。
![在这里插入图片描述](https://qiniuyun.sharkchili.com/202307112055109.png)
最终链表的指向尾节点的指针tail指向13由此完成将访问过的节点移动至链表尾部。
![在这里插入图片描述](https://qiniuyun.sharkchili.com/202307112055272.png)
通过图解我们大抵了解了`LinkedHashMap`访问后置的流程,接下来我们从`get`方法的源码为入口复盘一下上述的操作,`get`的执行步骤为:
1. 调用父类即`HashMap``getNode`获取键值对,若为空则直接返回。
2. 判断`accessOrder`是否为true若为true则说明需要保证`LinkedHashMap`的链表访问有序性执行步骤3。
3. 调用`LinkedHashMap`重写的`afterNodeAccess`将当前元素添加到链表末尾。
```java ```java
public V get(Object key) { public V get(Object key) {
@ -303,16 +237,13 @@ public LinkedHashMap(int initialCapacity,
} }
``` ```
上文提到保证访问有序的调用方法`afterNodeAccess`,从源码中我可以看到它完成的操作: 从源码可以看出,`get` 的执行步骤非常简单:
1. 调用父类即 `HashMap``getNode` 获取键值对,若为空则直接返回。
2. 判断 `accessOrder` 是否为 true若为 true 则说明需要保证 `LinkedHashMap` 的链表访问有序性,执行步骤 3。
3. 调用 `LinkedHashMap` 重写的 `afterNodeAccess` 将当前元素添加到链表末尾。
1. 如果`accessOrder` 为true且链表尾部不为当前节点p我们则需要将当前节点移到链表尾部。 关键点在于 `afterNodeAccess` 方法的实现,这个方法负责将元素移动到链表末尾。
2. 获取当前节点p、以及它的前驱节点b和后继节点a。
3. 将当前节点p的后继指针设置为null使其和后继节点p断开联系。
4. 尝试将前驱节点指向后继节点若前驱节点为空则说明当前节点p就是链表首节点故直接将后继节点a设置为首节点随后我们再将p追加到a的末尾。
5. 再尝试让后继节点a指向前驱节点b。
6. 上述操作让前驱节点和后继节点完成关联并将当前节点p独立出来这一步则是将当前节点p追加到链表末端如果链表末端为空则说明当前链表只有一个节点p所以直接让head指向p即可。
7. 上述操作已经将p成功到达链表末端最后我们将tail指针即指向链表末端的指针指向p即可。
```java ```java
void afterNodeAccess(Node < K, V > e) { // move node to last void afterNodeAccess(Node < K, V > e) { // move node to last
@ -327,7 +258,6 @@ void afterNodeAccess(Node<K,V> e) { // move node to last
//将当前节点的后继节点指针指向空,使其和后继节点断开联系 //将当前节点的后继节点指针指向空,使其和后继节点断开联系
p.after = null; p.after = null;
//如果前驱节点为空,则说明当前节点是链表的首节点,故将后继节点设置为首节点 //如果前驱节点为空,则说明当前节点是链表的首节点,故将后继节点设置为首节点
if (b == null) if (b == null)
head = a; head = a;
@ -335,7 +265,6 @@ void afterNodeAccess(Node<K,V> e) { // move node to last
//如果后继节点不为空,则让前驱节点指向后继节点 //如果后继节点不为空,则让前驱节点指向后继节点
b.after = a; b.after = a;
//如果后继节点不为空,则让后继节点指向前驱节点 //如果后继节点不为空,则让后继节点指向前驱节点
if (a != null) if (a != null)
a.before = b; a.before = b;
@ -359,47 +288,26 @@ void afterNodeAccess(Node<K,V> e) { // move node to last
} }
``` ```
从源码可以看出, `afterNodeAccess` 方法完成了下面这些操作:
1. 如果 `accessOrder` 为 true 且链表尾部不为当前节点 p我们则需要将当前节点移到链表尾部。
2. 获取当前节点 p、以及它的前驱节点 b 和后继节点 a。
3. 将当前节点 p 的后继指针设置为 null使其和后继节点 p 断开联系。
4. 尝试将前驱节点指向后继节点,若前驱节点为空,则说明当前节点 p 就是链表首节点,故直接将后继节点 a 设置为首节点,随后我们再将 p 追加到 a 的末尾。
5. 再尝试让后继节点 a 指向前驱节点 b。
6. 上述操作让前驱节点和后继节点完成关联,并将当前节点 p 独立出来,这一步则是将当前节点 p 追加到链表末端,如果链表末端为空,则说明当前链表只有一个节点 p所以直接让 head 指向 p 即可。
7. 上述操作已经将 p 成功到达链表末端,最后我们将 tail 指针即指向链表末端的指针指向 p 即可。
可以结合这张图理解,展示了 key 为 13 的元素被移动到了链表尾部。
![LinkedHashMap 移动元素 13 到链表尾部](https://oss.javaguide.cn/github/javaguide/java/collection/linkedhashmap-get.png)
看不太懂也没关系,知道这个方法的作用就够了,后续有时间再慢慢消化。
### remove 方法后置操作——afterNodeRemoval ### remove 方法后置操作——afterNodeRemoval
`LinkedHashMap` 并没有对 `remove` 方法进行重写,而实直接继承 `HashMap``remove` 方法,为了保证键值对移除后双向链表中的节点也会同步被移除,`LinkedHashMap` 重写了 `HashMap` 的空实现方法 `afterNodeRemoval` `LinkedHashMap` 并没有对 `remove` 方法进行重写,而实直接继承 `HashMap``remove` 方法,为了保证键值对移除后双向链表中的节点也会同步被移除,`LinkedHashMap` 重写了 `HashMap` 的空实现方法 `afterNodeRemoval`
我们还是以这个链表为例,来演示一下在`LinkedHashMap``afterNodeRemoval`方法如何将已和bucket断开联系的节点13从链表中移除。
![在这里插入图片描述](https://qiniuyun.sharkchili.com/202307112055254.png)
首先将13的前驱和后继指针指置空确保被删节点和其他节点断开联系。
![在这里插入图片描述](https://qiniuyun.sharkchili.com/202307112055115.png)
判断13是否有前驱节点如果有则将其后继指针指向13的后继节点让其与13断开联系所以前驱节点11指向了25。
![在这里插入图片描述](https://qiniuyun.sharkchili.com/202307112055429.png)
同理13后继节点若不为空则让其指向13的前驱节点所以25的前驱指针指向了11最终13就变成没有被任何引用指向的对象等待被gc。
![在这里插入图片描述](https://qiniuyun.sharkchili.com/202307112055885.png)
再来看看源码,我们可以看到从`HashMap`继承来的`remove`方法内部调用的`removeNode`方法将节点从bucket删除后调用了`afterNodeRemoval`
```java ```java
final Node<K,V> removeNode(int hash, Object key, Object value, final Node<K,V> removeNode(int hash, Object key, Object value,
boolean matchValue, boolean movable) { boolean matchValue, boolean movable) {
@ -425,16 +333,9 @@ final Node<K,V> removeNode(int hash, Object key, Object value,
void afterNodeRemoval(Node<K,V> p) { } void afterNodeRemoval(Node<K,V> p) { }
``` ```
我们可以看到从 `HashMap` 继承来的 `remove` 方法内部调用的 `removeNode` 方法将节点从 bucket 删除后,调用了 `afterNodeRemoval`
查看`afterNodeRemoval`的源码它的整体操作就是让当前节点p和前驱节点、后继节点断开联系等待gc回收整体步骤为: ```java
1. 获取当前节点p、以及e的前驱节点b和后继节点a。
2. 让当前节点p和其前驱、后继节点断开联系。
3. 尝试让前驱节点b指向后继节点a若b为空则说明当前节点p在链表首部我们直接将head指向后继节点a即可。
4. 尝试让后继节点a指向前驱节点b若a为空则说明当前节点p在链表末端所以直接让tail指针指向前驱节点a即可。
```bash
void afterNodeRemoval(Node<K,V> e) { // unlink void afterNodeRemoval(Node<K,V> e) { // unlink
//获取当前节点p、以及e的前驱节点b和后继节点a //获取当前节点p、以及e的前驱节点b和后继节点a
@ -459,20 +360,26 @@ void afterNodeRemoval(Node<K,V> e) { // unlink
} }
``` ```
从源码可以看出, `afterNodeRemoval` 方法的整体操作就是让当前节点 p 和前驱节点、后继节点断开联系,等待 gc 回收,整体步骤为:
1. 获取当前节点 p、以及 e 的前驱节点 b 和后继节点 a。
2. 让当前节点 p 和其前驱、后继节点断开联系。
3. 尝试让前驱节点 b 指向后继节点 a若 b 为空则说明当前节点 p 在链表首部,我们直接将 head 指向后继节点 a 即可。
4. 尝试让后继节点 a 指向前驱节点 b若 a 为空则说明当前节点 p 在链表末端,所以直接让 tail 指针指向前驱节点 a 即可。
可以结合这张图理解,展示了 key 为 13 的元素被删除,也就是从链表中移除了这个元素。
![LinkedHashMap 删除元素 13](https://oss.javaguide.cn/github/javaguide/java/collection/linkedhashmap-remove.png)
看不太懂也没关系,知道这个方法的作用就够了,后续有时间再慢慢消化。
### put 方法后置操作——afterNodeInsertion ### put 方法后置操作——afterNodeInsertion
同样的 `LinkedHashMap` 并没有实现插入方法,而是直接继承 `HashMap` 的所有插入方法交由用户使用,但为了维护双向链表访问的有序性,它做了这样两件事: 同样的 `LinkedHashMap` 并没有实现插入方法,而是直接继承 `HashMap` 的所有插入方法交由用户使用,但为了维护双向链表访问的有序性,它做了这样两件事:
1. 重写`afterNodeAccess`(上文提到过),如果当前被插入的key已存在与map中因为`LinkedHashMap`的插入操作会将新节点追加至链表末尾所以对于存在的key则调用`afterNodeAccess`将其放到链表末端。 1. 重写 `afterNodeAccess`(上文提到过),如果当前被插入的 key 已存在与 `map` 中,因为 `LinkedHashMap` 的插入操作会将新节点追加至链表末尾,所以对于存在的 key 则调用 `afterNodeAccess` 将其放到链表末端。
2. 重写了 `HashMap``afterNodeInsertion` 方法,当 `removeEldestEntry` 返回 true 时,会将链表首节点移除。 2. 重写了 `HashMap``afterNodeInsertion` 方法,当 `removeEldestEntry` 返回 true 时,会将链表首节点移除。
这一点我们可以在 `HashMap` 的插入操作核心方法 `putVal` 中看到。 这一点我们可以在 `HashMap` 的插入操作核心方法 `putVal` 中看到。
```java ```java
@ -497,48 +404,24 @@ final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
} }
``` ```
上述步骤的源码上文已经解释过了,所以这里我们着重了解一下 `afterNodeInsertion` 的工作流程,假设我们的重写了 `removeEldestEntry`,当链表 `size` 超过 `capacity` 时,就返回 true。
上述步骤的源码上文已经解释过了,所以这里我们着重了解一下`afterNodeInsertion`的工作流程,假设我们的重写了`removeEldestEntry`,当链表`size()`超过`capacity`就返回true。
```java ```java
/** /**
* 判断size超过容量时返回true告知LinkedHashMap移除最近最少访问的元素(即链表的第一个元素) * 判断size超过容量时返回true告知LinkedHashMap移除最老的缓存项(即链表的第一个元素)
* @param eldest
* @return
*/ */
protected boolean removeEldestEntry(Map.Entry < K, V > eldest) { protected boolean removeEldestEntry(Map.Entry < K, V > eldest) {
return size() > capacity; return size() > capacity;
} }
``` ```
以下图为例,假设笔者最后新插入了一个不存在的节点 19,假设 `capacity` 为 4所以 `removeEldestEntry` 返回 true我们要将链表首节点移除。
以下图为例假设笔者最后新插入了一个不存在的节点19,假设capacity为4所以removeEldestEntry返回true我们要将链表首节点移除。 ![LinkedHashMap 中插入新元素 19](https://oss.javaguide.cn/github/javaguide/java/collection/linkedhashmap-after-insert-1.png)
![在这里插入图片描述](https://qiniuyun.sharkchili.com/202307112055181.png)
移除的步骤很简单,查看链表首节点是否存在,若存在则断开首节点和后继节点的关系,并让首节点指针指向下一节点,所以 head 指针指向了 12节点 10 成为没有任何引用指向的空对象,等待 GC。 移除的步骤很简单,查看链表首节点是否存在,若存在则断开首节点和后继节点的关系,并让首节点指针指向下一节点,所以 head 指针指向了 12节点 10 成为没有任何引用指向的空对象,等待 GC。
![在这里插入图片描述](https://qiniuyun.sharkchili.com/202307112055209.png) ![LinkedHashMap 中插入新元素 19](https://oss.javaguide.cn/github/javaguide/java/collection/linkedhashmap-after-insert-2.png)
通过图解后我们查看源码,可以看到`afterNodeInsertion`执行步骤为:
1. 判断eldest是否为true只有为true才能说明可能需要将最年长的键值对(即链表首部的元素)进行移除,具体是否具体要进行移除,还得确定链表是否为空`((first = head) != null)`,以及`removeEldestEntry`方法是否返回true只有这两个方法返回true才能确定当前链表不为空且链表需要进行移除操作了。
2. 获取链表第一个元素的key。
3. 调用`HashMap``removeNode`方法该方法我们上文提到过它会将节点从HashMap的bucket中移除并且`LinkedHashMap`还重写了`removeNode`中的`afterNodeRemoval`方法,所以这一步将通过调用`removeNode`将元素从`HashMap`的bucket中移除并和`LinkedHashMap`的双向链表断开等待gc回收。
```java ```java
void afterNodeInsertion(boolean evict) { // possibly remove eldest void afterNodeInsertion(boolean evict) { // possibly remove eldest
@ -553,40 +436,25 @@ void afterNodeInsertion(boolean evict) { // possibly remove eldest
} }
``` ```
从源码可以看出, `afterNodeInsertion` 方法完成了下面这些操作:
1. 判断 `eldest` 是否为 true只有为 true 才能说明可能需要将最年长的键值对(即链表首部的元素)进行移除,具体是否具体要进行移除,还得确定链表是否为空`((first = head) != null)`,以及 `removeEldestEntry` 方法是否返回 true只有这两个方法返回 true 才能确定当前链表不为空,且链表需要进行移除操作了。
### removeEldestEntry 2. 获取链表第一个元素的 key。
3. 调用 `HashMap``removeNode` 方法,该方法我们上文提到过,它会将节点从 `HashMap` 的 bucket 中移除,并且 `LinkedHashMap` 还重写了 `removeNode` 中的 `afterNodeRemoval` 方法,所以这一步将通过调用 `removeNode` 将元素从 `HashMap` 的 bucket 中移除,并和 `LinkedHashMap` 的双向链表断开,等待 gc 回收。
还记得我们上文中LRU缓存案例吗我们继承`LinkedHashMap`后重写了空方法`removeEldestEntry`,该方法会在`LinkedHashMap`中的从`HashMap`继承的任何一个插入方法中被调用到所以我们的LRU缓存就是通过重写该方法的逻辑告知`LinkedHashMap`在链表的大小大于容量时就返回true`LinkedHashMap`将链表首元素移除。
```bash
/**
* 判断size超过容量时返回true告知LinkedHashMap移除最近最少访问的元素(即链表的第一个元素)
* @param eldest
* @return
*/
protected boolean removeEldestEntry(Map.Entry<K, V> eldest) {
return size() > capacity;
}
```
## LinkedHashMap 和 HashMap 遍历性能比较 ## LinkedHashMap 和 HashMap 遍历性能比较
`LinkedHashMap` 维护了一个双向链表来记录数据插入的顺序,因此在迭代遍历生成的迭代器的时候,是按照双向链表的路径进行遍历的。这一点相比于 `HashMap` 那种遍历整个 bucket 的方式来说,高效需多。 `LinkedHashMap` 维护了一个双向链表来记录数据插入的顺序,因此在迭代遍历生成的迭代器的时候,是按照双向链表的路径进行遍历的。这一点相比于 `HashMap` 那种遍历整个 bucket 的方式来说,高效需多。
这一点我们可以从两者的迭代器中得以印证,先来看看`HashMap`的迭代器可以看到HashMap迭代键值对时会用到一个`nextNode`方法该方法会返回next指向的下一个元素并会从next开始遍历bucket找到下一个bucket中不为空的元素Node。 这一点我们可以从两者的迭代器中得以印证,先来看看 `HashMap` 的迭代器,可以看到 `HashMap` 迭代键值对时会用到一个 `nextNode` 方法,该方法会返回 next 指向的下一个元素,并会从 next 开始遍历 bucket 找到下一个 bucket 中不为空的元素 Node。
```java ```java
final class EntryIterator extends HashIterator final class EntryIterator extends HashIterator
implements Iterator < Map.Entry < K, V >> { implements Iterator < Map.Entry < K, V >> {
public final Map.Entry<K,V> next() { return nextNode(); } public final Map.Entry < K,
V > next() {
return nextNode();
}
} }
//获取下一个Node //获取下一个Node
@ -606,14 +474,15 @@ void afterNodeInsertion(boolean evict) { // possibly remove eldest
} }
``` ```
相比之下 `LinkedHashMap` 的迭代器则是直接使用通过 `after` 指针快速定位到当前节点的后继节点,简洁高效需多。
相比之下`LinkedHashMap`的迭代器则是直接使用通过`after`指针快速定位到当前节点的后继节点,简洁高效需多。
```java ```java
final class LinkedEntryIterator extends LinkedHashIterator final class LinkedEntryIterator extends LinkedHashIterator
implements Iterator < Map.Entry < K, V >> { implements Iterator < Map.Entry < K, V >> {
public final Map.Entry<K,V> next() { return nextNode(); } public final Map.Entry < K,
V > next() {
return nextNode();
}
} }
//获取下一个Node //获取下一个Node
final LinkedHashMap.Entry < K, V > nextNode() { final LinkedHashMap.Entry < K, V > nextNode() {
@ -631,66 +500,61 @@ void afterNodeInsertion(boolean evict) { // possibly remove eldest
} }
``` ```
为了验证笔者所说的观点,笔者对这两个容器进行了压测,测试插入 1000w 和迭代 1000w 条数据的耗时,代码如下: 为了验证笔者所说的观点,笔者对这两个容器进行了压测,测试插入 1000w 和迭代 1000w 条数据的耗时,代码如下:
```java ```java
public static void main(String[] args) {
int count = 1000_0000; int count = 1000_0000;
Map<Integer, Integer> hashMap = new HashMap<>(); Map<Integer, Integer> hashMap = new HashMap<>();
Map<Integer, Integer> linkedHashMap = new LinkedHashMap<>(); Map<Integer, Integer> linkedHashMap = new LinkedHashMap<>();
Long start, end; long start, end;
start = System.currentTimeMillis(); start = System.currentTimeMillis();
for (int i = 0; i < count; i++) { for (int i = 0; i < count; i++) {
hashMap.put(RandomUtil.randomInt(1,count),RandomUtil.randomInt(1,count)); hashMap.put(ThreadLocalRandom.current().nextInt(1, count), ThreadLocalRandom.current().nextInt(0, count));
} }
end = System.currentTimeMillis(); end = System.currentTimeMillis();
System.out.println("map time putVal: " + (end - start)); System.out.println("map time putVal: " + (end - start));
start = System.currentTimeMillis(); start = System.currentTimeMillis();
for (int i = 0; i < count; i++) { for (int i = 0; i < count; i++) {
linkedHashMap.put(RandomUtil.randomInt(1,count),RandomUtil.randomInt(1,count)); linkedHashMap.put(ThreadLocalRandom.current().nextInt(1, count), ThreadLocalRandom.current().nextInt(0, count));
} }
end = System.currentTimeMillis(); end = System.currentTimeMillis();
System.out.println("linkedHashMap putVal time: " + (end - start)); System.out.println("linkedHashMap putVal time: " + (end - start));
start = System.currentTimeMillis(); start = System.currentTimeMillis();
long num = 0;
for (Integer v : hashMap.values()) { for (Integer v : hashMap.values()) {
num = num + v;
} }
end = System.currentTimeMillis(); end = System.currentTimeMillis();
System.out.println("map get time: " + (end - start)); System.out.println("map get time: " + (end - start));
start = System.currentTimeMillis(); start = System.currentTimeMillis();
for (Integer v : linkedHashMap.values()) { for (Integer v : linkedHashMap.values()) {
num = num + v;
} }
end = System.currentTimeMillis(); end = System.currentTimeMillis();
System.out.println("linkedHashMap get time: " + (end - start)); System.out.println("linkedHashMap get time: " + (end - start));
} System.out.println(num);
``` ```
从输出结果来看,因为 `LinkedHashMap` 需要维护双向链表的缘故,插入元素相较于 `HashMap` 会更耗时,但是有了双向链表明确的前后节点关系,迭代效率相对于前者高效了需多。不过,总体来说却别不大,毕竟数据量这么庞大。
从输出结果来看,因为`LinkedHashMap`需要维护双向链表的缘故,相较于`Hashmap`会更耗时,但是有了双向链表明确的前后节点关系,迭代效率相对于前者高效了需多。 ```bash
map time putVal: 5880
linkedHashMap putVal time: 7567
```java map get time: 143
map time putVal: 6794 linkedHashMap get time: 67
linkedHashMap putVal time: 7882 63208969074998
map get time: 131
linkedHashMap get time: 59
``` ```
## LinkedHashMap 常见面试题 ## LinkedHashMap 常见面试题
### 什么是 LinkedHashMap ### 什么是 LinkedHashMap
`LinkedHashMap`是Java集合框架中`HashMap`的一个子类,它继承了`HashMap`的所有属性和方法并且在HashMap的基础重写了`afterNodeRemoval``afterNodeInsertion``afterNodeAccess`方法。使之拥有顺序插入和访问有序的特性。 `LinkedHashMap` Java 集合框架中 `HashMap` 的一个子类,它继承了 `HashMap` 的所有属性和方法,并且在 `HashMap` 的基础重写了 `afterNodeRemoval``afterNodeInsertion``afterNodeAccess` 方法。使之拥有顺序插入和访问有序的特性。
### LinkedHashMap 如何按照插入顺序迭代元素? ### LinkedHashMap 如何按照插入顺序迭代元素?
@ -706,18 +570,10 @@ linkedHashMap get time: 59
### LinkedHashMap 和 HashMap 有什么区别? ### LinkedHashMap 和 HashMap 有什么区别?
`LinkedHashMap``HashMap`都是Java集合框架中的Map接口的实现类。它们的最大区别在于迭代元素的顺序。`HashMap`迭代元素的顺序是不确定的而LinkedHashMap提供了按照插入顺序或访问顺序迭代元素的功能。此外`LinkedHashMap`内部维护了一个双向链表,用于记录元素的插入顺序或访问顺序,而`HashMap`则没有这个链表。因此,`LinkedHashMap`的插入性能可能会比`HashMap`略低,但它提供了更多的功能并且迭代效率相较于`HashMap`更加高效。 `LinkedHashMap``HashMap` 都是 Java 集合框架中的 Map 接口的实现类。它们的最大区别在于迭代元素的顺序。`HashMap` 迭代元素的顺序是不确定的,而 `LinkedHashMap` 提供了按照插入顺序或访问顺序迭代元素的功能。此外,`LinkedHashMap` 内部维护了一个双向链表,用于记录元素的插入顺序或访问顺序,而 `HashMap` 则没有这个链表。因此,`LinkedHashMap` 的插入性能可能会比 `HashMap` 略低,但它提供了更多的功能并且迭代效率相较于 `HashMap` 更加高效。
## 参考文献 ## 参考文献
[LinkedHashMap 源码详细分析JDK1.8](https://www.imooc.com/article/22931) - LinkedHashMap 源码详细分析JDK1.8:<https://www.imooc.com/article/22931>
- HashMap 与 LinkedHashMap:<https://www.cnblogs.com/Spground/p/8536148.html>
- 源于 LinkedHashMap 源码: <https://leetcode.cn/problems/lru-cache/solution/yuan-yu-linkedhashmapyuan-ma-by-jeromememory/>
[HashMap与LinkedHashMap](https://www.cnblogs.com/Spground/p/8536148.html#:~:text=LinkedHashMap%20%E5%92%8C%20HashMap%20%E6%80%A7%E8%83%BD%E7%9A%84%E6%AF%94%E8%BE%83:%E5%9C%A8%E5%9F%BA%E6%9C%AC%E7%9A%84%20put,get%20remove%20%E6%93%8D%E4%BD%9C%EF%BC%8C%E4%B8%A4%E8%80%85%E7%9A%84%E6%80%A7%E8%83%BD%E5%87%A0%E4%B9%8E%E7%9B%B8%E8%BF%91%EF%BC%8C%E7%94%B1%E4%BA%8E%20LinkedHashMap%20%E7%BB%B4%E6%8A%A4%E7%9D%80%E4%B8%80%E4%B8%AA%E5%8F%8C%E5%90%91%E9%93%BE%E8%A1%A8%EF%BC%8C%E5%9B%A0%E6%AD%A4%E6%80%A7%E8%83%BD%E5%8F%AF%E8%83%BD%E7%A8%8D%E5%BE%AE%E5%B7%AE%E4%B8%80%E7%82%B9%E7%82%B9%E3%80%82)
[源于 LinkedHashMap源码](https://leetcode.cn/problems/lru-cache/solution/yuan-yu-linkedhashmapyuan-ma-by-jeromememory/)

View File

@ -49,7 +49,7 @@ icon: "book"
## 大数据 ## 大数据
- [BigData-Notes](https://github.com/heibaiying/BigData-Notes "BigData-Notes") :大数据入门指南 ⭐️ - [juicy-bigdata](https://github.com/datawhalechina/juicy-bigdata):妙趣横生大数据,大数据技术相关内容的导论课程
- [flink-learning](https://github.com/zhisheng17/flink-learning "flink-learning"):含 Flink 入门、概念、原理、实战、性能调优、源码解析等内容。 - [flink-learning](https://github.com/zhisheng17/flink-learning "flink-learning"):含 Flink 入门、概念、原理、实战、性能调优、源码解析等内容。
## 开源书籍 ## 开源书籍