本文最后更新于：May 26, 2022 pm

积土成山，风雨兴焉；积水成渊，蛟龙生焉；积善成德，而神明自得，圣心备焉。故不积跬步，无以至千里，不积小流无以成江海。齐骥一跃，不能十步，驽马十驾，功不在舍。面对悬崖峭壁，一百年也看不出一条裂缝来，但用斧凿，能进一寸进一寸，能进一尺进一尺，不断积累，飞跃必来，突破随之。

但问题是一个 40 亿长度的数组，内存是放不下的。所以这个散列值是不能直接拿来用的。用之前还要先做对数组的长度取模运算（即进行范围限制），得到的余数才是用来要存放的位置，也就是对应的数组下标。但这个下标要怎么算？

正常的话我们肯定会采用取模运算（%）进行一个取模：

1	`n%hash //n表示长度`

但是在HashMap中采用的是位运算：

1	`(n - 1) & hash //n表示长度`

而使用这种方式的话，n就必须为2的幂次方。

分析

假如 hash=4095 的二进制表示为：1111 1111 1111 ，假如 n=16 的二进制表示为：1 0000

所以 n-1=15 的二进制表示为：0 1111

然后就进行按位与运算：

1111 1111 1111（hash）

0000 0000 1111（n-1）

0000 0000 1111（这就是(n - 1) & hash，即 hash%n ）

这是hash的二进制全为1的情况。

假如 hash=4023 的二进制表示为：1111 1011 0111 ，假如 n=16 的二进制表示为：1 0000

所以 n-1=15 的二进制表示为：0 1111

然后就进行按位与运算：

1111 1011 0111（hash）

0000 0000 1111（n-1）

0000 0000 0111（这就是(n - 1) & hash，即 hash%n ）

总结

因为 n 为2的幂次方，所以n的二进制表示中只有一个1；然后n-1的二进制表示中是除去有效最高位外，右边部分全是1。那么全与其他数进行按位与时，最大即为n-1，否则比n-1小。

2022年5月26日

HashMap在扩容上的优化。

采用2的幂次方作为长度的另外一个原因在于扩容时，key的hash值计算。

在同一个桶中的key，在扩容后，HashMap容量翻倍，再去取模，实际上是需要高一位来参与计算的（即新增的最高位）。

当高位是0时，newBucketIndex = oldBucketIndex，此时元素还是存放在原来的桶中；

当高位是1时，newBucketIndex = oldBucketIndex + oldTable.length，这时元素需要移动到扩容产生的桶中。

JAVA集合源码

JAVA 集合 JAVA集合源码

本文作者: 墨水记忆
本文链接: https://tothefor.com/DragonOne/493ab5d5.html
版权声明: 本博客所有文章除特别声明外，均采用 CC BY-SA 4.0 协议，转载请注明出处！