为了解决jdk1.8以前hash冲突所导致的链化严重的问题,因为链表结构的查询效率是非常低的(O(n)),树结构的查询效率会高一些。
HashMap可以提供快速访问能力,即通过key可以查询到相应的value,通过哈希函数可以决定键值对的位置,在理想状况下(不出现hash冲突),查询的时间复杂度为O(1),当出现hash冲突时,使用开散列表解决冲突,对应一个特定hash值的位置存储的是一个链表头,指向hash到同一个位置的多个键值对组成的链表。
HashMap的数据是存在Node[] table数组(哈希桶)中的,它是一个Entry数组,Entry是HashMap的一个静态内部类。Entry封装了hash(定位数组索引位置)、key、value,next是指向链表的下一个Node节点。
Map.Entry是Map的一个内部接口。
Map.Entry的常用方法:
引用美团技术团队的图片:
①.判断键值对数组table[i]是否为空或为null,否则执行resize()进行扩容; ②.根据键值key计算hash值得到插入的数组索引i,如果table[i]==null,直接新建节点添加,转向⑥,如果table[i]不为空,转向③; ③.判断table[i]的首个元素是否和key一样,如果相同直接覆盖value,否则转向④,这里的相同指的是hashCode以及equals; ④.判断table[i] 是否为treeNode,即table[i] 是否是红黑树,如果是红黑树,则直接在树中插入键值对,否则转向⑤; ⑤.遍历table[i],判断链表长度是否大于8,大于8的话把链表转换为红黑树,在红黑树中执行插入操作,否则进行链表的插入操作;遍历过程中若发现key已经存在直接覆盖value即可; ⑥.插入成功后,判断实际存在的键值对数量size是否超多了最大容量threshold,如果超过,进行扩容。
不同的对象具有不同的hash值,当两个不同的对象计算出的hash值相同时便产生了hash冲突,HashMap使用数组+链表(链地址法)解决hash冲突。
map.put("key1","value1");
map.put("key 2","value 2");
...
map.put("hashCode n","value n");
调用map的put方法进行数据存储时,首先根据key计算其hashCode,然后进行取模运算和高位运算来确定value的存储位置,在后期的调用put方法时不同的key计算得到的位置可能是一样的,这时会产生hash碰撞。
在HashMap其中一个构造函数中,可以指定HashMap的初始容量和负载因子,这两个变量关系到HashMap的扩容。
比如说当前的默认容器容量是16,负载因子是0.75,16*0.75=12,也就是说,容器中超过12个元素的时候就会进行扩容操作。HashMap以2的整数次幂扩容。
1.This map usually acts as a binned (bucketed) hash table 2.static final int MAXIMUM_CAPACITY = 1 << 30; 3.static final float DEFAULT_LOAD_FACTOR = 0.75f; 4.static final int UNTREEIFY_THRESHOLD = 6; 5.static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16
resize源码:
final Node<K,V>[] resize() {
Node<K,V>[] oldTab = table;
int oldCap = (oldTab == null) ? 0 : oldTab.length;
int oldThr = threshold;
int newCap, newThr = 0;
if (oldCap > 0) {
//如果当前长度大于最大容器长度(2的30次幂 1073741824则直接返回该对象,1073741824是极限长容量
//static final int MAXIMUM_CAPACITY = 1 << 30;
if (oldCap >= MAXIMUM_CAPACITY) {
threshold = Integer.MAX_VALUE;
return oldTab;
}
//如果当前长度小于最大容量且小于默认容量16,对原数据进行2倍扩容
else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
oldCap >= DEFAULT_INITIAL_CAPACITY)
newThr = oldThr << 1; // double threshold
}
else if (oldThr > 0) // initial capacity was placed in threshold
newCap = oldThr;
else { // zero initial threshold signifies using defaults
newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
}
//计算resize上限
if (newThr == 0) {
float ft = (float)newCap * loadFactor;
newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
(int)ft : Integer.MAX_VALUE);
}
threshold = newThr;
@SuppressWarnings({"rawtypes","unchecked"})
Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab;
if (oldTab != null) {
// 把每个bucket都移动到扩容后的buckets中
for (int j = 0; j < oldCap; ++j) {
Node<K,V> e;
if ((e = oldTab[j]) != null) {
oldTab[j] = null;
if (e.next == null)
newTab[e.hash & (newCap - 1)] = e;
else if (e instanceof TreeNode)
((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
else { // preserve order
Node<K,V> loHead = null, loTail = null;
Node<K,V> hiHead = null, hiTail = null;
Node<K,V> next;
//省略移动bucket部分代码
...
}
return newTab;
}
参考文献: