当前位置: 首页>后端>正文

HashMap源码分析&底层数据结构分析

? ? ? ? HashMap 主要用来存放键值对,它基于哈希表的 Map 接口实现,是常用的 Java 集合之一,是非线程安全的。HashMap 可以存储 null 的 key 和 value,但 null 作为键只能有一个,null 作为值可以有多个。

? ? ? ? 影响HashMap的性能: 初始数组容量16(inital capacity)负载系数(load factor)0.75,超过容量*0.75 就会自动扩容,每次扩容是原来容量的2倍。容量是指存储的键值对的数量

? ? ? ? Java7中Hashmap底层采用的是Entry对数组,1.8之后是Node对象数组

? ? ? ?Java7 是先扩容后插入新值的,Java8 先插值再扩容。

? ? ? ? HashMap 通过 key 的 hashCode 经过扰动函数处理过后得到 hash 值,然后通过?(n - 1) & hash?判断当前元素存放的位置(这里的 n 指的是数组的长度),如果当前位置存在元素的话,就判断该元素与要存入的元素的 hash 值以及 key 是否相同,如果相同的话,直接覆盖,不相同就通过拉链法解决冲突链表则是主要为了解决哈希冲突而存在的。

? ? ? ? 扰动函数指的就是 HashMap 的 hash 方法。使用 hash 方法也就是扰动函数是为了防止一些实现比较差的 hashCode() 方法 换句话说使用扰动函数之后可以减少碰撞。

? ? ? ? 拉链法:链表和数组相结合。也就是说将当前数组中的键值对改变成链表形式,然后将冲突的键值对加到链表中(采用头插法插入元素)。不同就采用头插法插入元素。JDK1.8 以后的?HashMap ,当链表长度大于阈值(默认为 8)并且数组的长度大于等于64,会将链表转换成红黑树;如果当前数组的长度小于 64,那么会选择先进行数组扩容。

? ? ? ?每次扩容,相当于重新创建个指定大小的数组,会伴随着一次重新 hash 分配,并且会遍历 hash 表中所有的元素,是非常耗时的。在编写程序中,要尽量避免 resize

? ? ? ?HashMap在多线程情况下会导致死循环,主要原因在于并发下调用 resize() 方法里的 rehash() 时,容易出现环形链表。这样当获取一个不存在的 key 时,计算出的 index 正好是环形链表的下标时就会出现死循环。不过,jdk 1.8 后解决了这个问题,但是还是不建议在多线程下使用 HashMap,因为多线程下使用 HashMap 还是会存在其他问题比如数据丢失。并发环境下推荐使用 ConcurrentHashMap


https://www.xamrdz.com/backend/3xe1932480.html

相关文章: