HashMap每次扩容时，为什么都必须是2的N次方?

最近有粉丝问壹哥，为什么HashMap每次扩容时，都必须是2的N次方？

其实要想弄明白这个问题，我们就必须知道HashMap的底层源码结构。接下来壹哥就带各位来分析一下HashMap的底层设计。

我们知道，HashMap的底层是通过数组+链表+红黑树的数据结构来存放数据的。当新添加元素的key值出现了hash碰撞，就会在同一 个 bucket中形成链表或者红黑树 。 当键值对的数量超过阈值时就会扩容，将以前处于同一个链表或者红黑树上的元素打散，在新数组的 bucket 上进行重新分布。

当HashMap在初始化没有指定容量的情况下，首次添加元素时，数组的容量为16；当超出阈值，数组容量为扩容为之前的2倍。

那么问题来了，为什么HashMap会将首次初始化容量设置为16，而后续每次扩容都是之前的2倍？而不是像ArrayList首次为10，后续为1.5倍呢？这可是我们在面试时的一个高频考点哦！壹哥提醒各位，一定要搞清楚这一点哦。

对应源码分析

其实要想回答出上面提出的问题，我们可以从HashMap的源码里找到答案，如下图所示：

其中 n 为数组的长度，n - 1 为数组的最大索引值 。 （n - 1）& hash 的意思是将每个元素key的hash值 ， 与最大索引值进行相与 操作。 然后判断对应的 bucket 位置是否有元素，如果没有元素则在对应的 bucket 位置直接添加；如果有元素，则形成链表或者红黑树。

深入分析

各位看官，你现在可能对上面的内容还是有点云里雾里，别急，让我们再来看一组数据：

长度	最大索引	二进制数
16	15	1111
32	31	11111
64	63	111111

当数组初始长度为16的时候，每次扩容都为之前的2倍，那么就保证了每次扩容之后新数组的最大索引值对应的二进制数为全1 。根据2.1小节中，图片标识的 (n - 1) & hash，那么就能保证添加到HashMap中key的hash值与最大索引相与时，能够最大化的分散到HashMap所有的 bucket 中，进而最大化避免出现 hash碰撞而形成链表或者红黑树。

壹哥再反向地跟各位看官论证一下。假如说 HashMap的初始化长度是10，那么最大索引值为9，而9对应的二进制数是 1001。那么key的hash值与 9相与，结果只可能为 0、1、8、9，那么新增的数据永远只能放到数组索引为 0、1、8、9这四个位置，这就大大增加了出现链表和红黑树转换的概率。

所以初始化为16，每次扩容是之前的2倍，这就大大降低了链表和红黑树转换的概率，自然也就提高了HashMap的性能。 现在你明白了吗？

作者：一一哥Sun
链接：https://juejin.cn/post/7177982041089605693
来源：稀土掘金

展开阅读全文

页面更新：2024-04-16

标签：阈值相与次方数组初始化底层源码长度索引元素容量

1 2 3 4 5

HashMap每次扩容时，为什么都必须是2的N次方?

对应源码分析

深入分析

永倍达清退传统思路，建设虚拟零售新模式

OPPO这款新机，上市没多久降至1599元起，颜值高配置全面，特别香

香港时装结合人工智能激发设计灵感

“黑周一”魔咒！医药股暴跌，A股回调已到位？

无压力快速增长中！美容护理领域爱美客（2022三季报分析）

对话西贝餐饮董事长贾国龙：不确定性正结束，将进一步考验企业现金流，而后迎来复苏

欧盟“碳关税”艰难登场

钠离子电池行业研究：产业链视角看钠电应用和投资机会

风信已起，你还等什么？写在12月19日开盘前的话

出海归来！江浙经贸团收获的不仅是订单

复旦大学老龄研究院发布《中国银发经济发展研究报告》

单日放巨量的10只股票，后续可持续关注

曹操出行IPO传闻再起，网约车市场难题待解

五粮液集团曾从钦：抓住五个“深度融合”，建设全球酒业和美生态圈

透视ESG信披样本：企业如何答好社会责任这道题？

ChatGPT爆红，百度、搜狗、360等搜索引擎尴尬吗？

世界上单机容量最大！白鹤滩水电站16台百万千瓦水轮发电

某爆雷信托公司底层资产清单

好消息ECMAScript 2023将新增的9个数组方法

RocketMQ源码之broker高可用CommitLog管理组件DLedger

Java中synchronized的底层实现原理

RocketMQ源码之DLedger存储实现DLedgerMmapFileStore

注入了太空元素的笔记本电脑会是什么样子？华硕给你一个

卡文：尝试将东西方元素融入作品，给读者带来独特的阅读体

我们的社会在不断贬低底层的普通人