分析轮子（十）- HashMap.java 之概念梳理

2021-06-16 22:06

阅读：682

标签：线程 shm for 编写 sdn @param 最大 src set

注：玩的是JDK1.7版本

一：还是原来的风格，先上一下类的继承关系图，这样能够比较清楚的知道此类的相关特性

技术分享图片

二：HashMap.java 的代码比较难看，所以，我看了几天，写的话也分开来写，这样能表达的更清晰，HashMap.java 的底层数据结构，本质是单向链表数组，如下所示是单向链中节点的结构信息

技术分享图片

三：既然 HashMap.java 的底层数据结构是单向链表数组，那么我们便可以想象一下数组和单向链表这两种数据结构的特点，然后再回头想想 HashMap.java 的实现，然后再看源码就更容易理解了，如下所示是可能的结构样子。

1）通常应该是如下所示的结构形式，哈希值比较均匀，部分存在冲突

技术分享图片

2）极端情况可能是如下所示的结构形式，存在大量冲突，单向链表数组变成了单向链表

技术分享图片

3）极端情况可能是如下所示的结构形式，没有任何冲突，单向链表数组变成了简单的数组

技术分享图片

四：看完如上 HashMap.java 的底层数据结构的可能呈现的样子之后，我们再看一下 HashMap.java 中的有关属性，个人感觉可能的结构了解后，更容易理解这些属性的本质，注意：HashMap.java 的特点是可动态扩容哈！

技术分享图片

1）HashMap的默认初始化容量（16），表示HashMap当前最多能够装载16个元素，注意：必须是2的幂次方

    /**
     * The default initial capacity - MUST be a power of two.
     */
    static final int DEFAULT_INITIAL_CAPACITY = 1 // aka 16

2）HashMap的最大容量 2的30次方=1073741824

    /**
     * The maximum capacity, used if a higher value is implicitly specified
     * by either of the constructors with arguments.
     * MUST be a power of two */
    static final int MAXIMUM_CAPACITY = 1

3）HashMap默认的装载因子（0.75f），用于衡量HashMap满的程度，0.75=3/4，换言之当HashMap中的元素超过容量的3/4的时候，HashMap就会进行动态的扩容

    /**
     * The load factor used when none specified in constructor.
     */
    static final float DEFAULT_LOAD_FACTOR = 0.75f;

4）HashMap没有真正放置元素时，是一个空数组

    /**
     * An empty table instance to share when the table is not inflated.
     */
    static final Entry,?>[] EMPTY_TABLE = {};

5）HashMap没有真正放置元素时，是一个空数组，注意：HashMap的容量长度必须是2的幂次方

    /**
     * The table, resized as necessary. Length MUST Always be a power of two.
     */
    transient Entry[] table = (Entry[]) EMPTY_TABLE;

6）HashMap中 key-value mapping 映射对的个数

    /**
     * The number of key-value mappings contained in this map.
     */
    transient int size;

7）HashMap 动态扩容的临界值，每当 size>threshold 的时候，HashMap 就会动态扩容了，threshold = capacity * load factor

    /**
     * The next size value at which to resize (capacity * load factor).
     * @serial
     */
    // If table == EMPTY_TABLE then this is the initial capacity at which the
    // table will be created when inflated.
    int threshold;

8）装载因子，用于 HashMap 是否进行动态扩容计算的变量之一，默认值是0.75f，如无必要通常不必改变

    /**
     * The load factor for the hash table.
     *
     * @serial
     */
    final float loadFactor;

五：实验实验，玩一把，看看什么情况

1）结论性信息的都放在了代码注释之中，如下所示（可以自己动手调整一下参数配置，跑跑看）

/**
 * @description：玩一把HashMap
 * @author：godtrue
 * @create：2018-09-28
 */
public class TestMap {

    /**
     * 开始循环的基数
     */
    public static final int START_LOOP=1;

    /**
     * 结束循环的基数
     */
    public static final int END_LOOP=17;

    /**
    *
    *@description: 测试入口，主方法
    *@param args
    *@return: void
    *@author: godtrue
    *@createTime: 2018-09-28 9:53
    *@version: v1.0
    */
    public static void main(String[] args) {
        /**
         * 此处可以调用不同的构造方法来观察，HashMap 的容量、装载因子、扩容临界值、K-V映射对的个数等重点参数之间的关系
         * 重点强调一次
         * 1：capacity 容量——HashMap最多能装载元素个数
         * 2：loadFactor 装载因子——表示HashMap满的程度，判断HashMap是否扩容的变量之一
         * 3：threshold 扩容临界值——判断HashMap是否扩容的标准（ threshold = capacity * loadFactor ）
         * 4：size HashMap 已经装载的元素个数——已经转载进入HashMap的 K-V mapping 映射对的个数
         *
         * 5：HashMap 能够动态扩容，当 size > threshold 时 HashMap，便会自动库容，每次扩容的长度是原来 容量 的 2 倍
         * 6：HashMap 的 key 和 value 都可以为 null
         * 7：HashMap 是非线程安全的
         *
         */
        //Map hashMap = new HashMap();
        Map hashMap = new HashMap(1);
        for(int i = TestMap.START_LOOP;i){
            /**
             * 此处可以控制 key 值，来观察一下运行的情况
             */
            //hashMap.put(null,"i am godtrue"+i);
            //hashMap.put("godtrue","i am godtrue"+i);
            hashMap.put("godtrue"+i,"i am godtrue"+i);
            printMapInfo(hashMap,i);
        }
        System.out.println("hashMap is : "+hashMap);
    }

    /**
    *
    *@description: 将 Map 的参数信息打印到控制台，主要是打印 容量、装载因子、扩容临界值、K-V映射对的个数 等参数信息
    *@param map
    *@param i
    *@return: void
    *@author: godtrue
    *@createTime: 2018-09-28
    *@version: v1.0
    */
    private synchronized static void printMapInfo(Map map,int i){
        System.out.println("添加第 "+i +" 个元素后");
        printMapMethodInfo(map,"capacity");
        printMapFieldInfo(map,"loadFactor");
        printMapFieldInfo(map,"threshold");
        printMapFieldInfo(map,"size");
        System.out.println("***********************************************\n");
    }

    /**
    *
    *@description:  将 Map 的属性信息打印到控制台，主要是打印 装载因子、扩容临界值、K-V映射对的个数 等参数信息
    *@param map
    *@param property
    *@return: void
    *@author: godtrue
    *@createTime: 2018-09-28
    *@version: v1.0
    */
    private static void printMapFieldInfo(Map map,String property){
        try {
            Class> mapType = map.getClass();
            Field field = mapType.getDeclaredField(property);
            field.setAccessible(true);
            System.out.println(field +" : "+ field.get(map));
        }catch (Exception e){
            System.err.println("e is :"+e);
            e.printStackTrace();
        }
    }

    /**
    *
    *@description: 将 Map 的方法信息打印到控制台，主要是想打印 容量 的信息
    *@param map
    *@param property
    *@return: void
    *@author: godtrue
    *@createTime: 2018-09-28
    *@version: v1.0
    */
    private static void printMapMethodInfo(Map map,String property){
        try {
            Class> mapType = map.getClass();
            Method method = mapType.getDeclaredMethod(property);
            method.setAccessible(true);
            System.out.println(method +" : "+ method.invoke(map));
        }catch (Exception e){
            System.err.println("e is :"+e);
            e.printStackTrace();
        }
    }
}

2）仔细观察如下日志，可以印证上述代码注释中的部分结论，注意：请重点关注 capacity、loadFactor、threahold、size之间的变化关系

添加第 1 个元素后
int java.util.HashMap.capacity() : 1
final float java.util.HashMap.loadFactor : 0.75
int java.util.HashMap.threshold : 0
transient int java.util.HashMap.size : 1
***********************************************

添加第 2 个元素后
int java.util.HashMap.capacity() : 2 //扩容
final float java.util.HashMap.loadFactor : 0.75
int java.util.HashMap.threshold : 1
transient int java.util.HashMap.size : 2
***********************************************

添加第 3 个元素后
int java.util.HashMap.capacity() : 4 //扩容
final float java.util.HashMap.loadFactor : 0.75
int java.util.HashMap.threshold : 3
transient int java.util.HashMap.size : 3
***********************************************

添加第 4 个元素后
int java.util.HashMap.capacity() : 4
final float java.util.HashMap.loadFactor : 0.75
int java.util.HashMap.threshold : 3
transient int java.util.HashMap.size : 4
***********************************************

添加第 5 个元素后
int java.util.HashMap.capacity() : 8 //扩容
final float java.util.HashMap.loadFactor : 0.75
int java.util.HashMap.threshold : 6
transient int java.util.HashMap.size : 5
***********************************************

添加第 6 个元素后
int java.util.HashMap.capacity() : 8
final float java.util.HashMap.loadFactor : 0.75
int java.util.HashMap.threshold : 6
transient int java.util.HashMap.size : 6
***********************************************

添加第 7 个元素后
int java.util.HashMap.capacity() : 8
final float java.util.HashMap.loadFactor : 0.75
int java.util.HashMap.threshold : 6
transient int java.util.HashMap.size : 7
***********************************************

添加第 8 个元素后
int java.util.HashMap.capacity() : 8
final float java.util.HashMap.loadFactor : 0.75
int java.util.HashMap.threshold : 6
transient int java.util.HashMap.size : 8
***********************************************

添加第 9 个元素后
int java.util.HashMap.capacity() : 16 //扩容
final float java.util.HashMap.loadFactor : 0.75
int java.util.HashMap.threshold : 12
transient int java.util.HashMap.size : 9
***********************************************

添加第 10 个元素后
int java.util.HashMap.capacity() : 16
final float java.util.HashMap.loadFactor : 0.75
int java.util.HashMap.threshold : 12
transient int java.util.HashMap.size : 10
***********************************************

添加第 11 个元素后
int java.util.HashMap.capacity() : 16
final float java.util.HashMap.loadFactor : 0.75
int java.util.HashMap.threshold : 12
transient int java.util.HashMap.size : 11
***********************************************

添加第 12 个元素后
int java.util.HashMap.capacity() : 16
final float java.util.HashMap.loadFactor : 0.75
int java.util.HashMap.threshold : 12
transient int java.util.HashMap.size : 12
***********************************************

添加第 13 个元素后
int java.util.HashMap.capacity() : 32 //扩容
final float java.util.HashMap.loadFactor : 0.75
int java.util.HashMap.threshold : 24
transient int java.util.HashMap.size : 13
***********************************************

添加第 14 个元素后
int java.util.HashMap.capacity() : 32
final float java.util.HashMap.loadFactor : 0.75
int java.util.HashMap.threshold : 24
transient int java.util.HashMap.size : 14
***********************************************

添加第 15 个元素后
int java.util.HashMap.capacity() : 32
final float java.util.HashMap.loadFactor : 0.75
int java.util.HashMap.threshold : 24
transient int java.util.HashMap.size : 15
***********************************************

添加第 16 个元素后
int java.util.HashMap.capacity() : 32
final float java.util.HashMap.loadFactor : 0.75
int java.util.HashMap.threshold : 24
transient int java.util.HashMap.size : 16
***********************************************

hashMap is : {godtrue4=i am godtrue4, godtrue5=i am godtrue5, godtrue2=i am godtrue2, godtrue3=i am godtrue3, godtrue8=i am godtrue8, godtrue9=i am godtrue9, godtrue6=i am godtrue6, godtrue7=i am godtrue7, godtrue1=i am godtrue1, godtrue10=i am godtrue10, godtrue12=i am godtrue12, godtrue11=i am godtrue11, godtrue14=i am godtrue14, godtrue13=i am godtrue13, godtrue16=i am godtrue16, godtrue15=i am godtrue15}

Process finished with exit code 0

六：几个为什么？

1）为什么 HashMap 的默认容量是 16，并且强调容量必须是 2 的幂次方呢？

HashMap 的容量必须是 2 的幂次方，主要是出于性能的考虑，可以使用位于运算来计算单向链表数组的下标位置。

详情可参考

http://www.hollischuang.com/archives/2091

http://www.cnblogs.com/chenssy/p/3521565.html

https://blog.csdn.net/justloveyou_/article/details/62893086

默认值为什么是16呢？

首先，16 是 2的4次方，符合容量是 2 的幂次方的强性规定，其次，我猜测 16 可能是一个样本比较集中的 HashMap的容量

2）为什么 HashMap 的默认装载因子是 0.75f，并且不建议自定义呢？

HashMap 的默认装载因子是0.75f，主要是时间和空间成本上一种折衷。

详情可参考

http://alex09.iteye.com/blog/539545/

3）为什么 HashMap 在扩容的时候，总是扩大原来容量的 2 倍呢？

首先，容量扩大 2 倍后，仍然符合容量是 2 的幂次方的强性规定，其次，同样是出于性能考虑，直接通过左移移位便可实现

七）本篇，编写的过程中参考了 http://www.hollischuang.com/archives/2416

分析轮子（十）- HashMap.java 之概念梳理

标签：线程 shm for 编写 sdn @param 最大 src set

原文地址：https://www.cnblogs.com/godtrue/p/9714415.html

上一篇：Java程序语言的后门-反射机制

下一篇：only size-1 arrays can be converted to Python scalars

文章来自：搜素材网的编程语言模块，转载请注明文章出处。
文章标题：分析轮子（十）- HashMap.java 之概念梳理
文章链接：http://soscw.com/essay/94760.html

亲，登录后才可以留言！

分析轮子（十）- HashMap.java 之概念梳理

评论

热门文章

推荐文章

最新文章

置顶文章