通过源码探查HashSet究竟是如何保证唯一性的

面试官：你能简单介绍下List和Set有什么区别吗？

小憨：

List是一个有序的集合，在内存是连续存储的，可以存储重复的元素，List查询快，增删慢；
Set是一个无序的集合，在内存中不连续，不可以存储重复的元素，Set增删快，查询慢；

面试官：那HashSet是如何保证元素不重复的？

小憨： 3分钟。。。

为了避免出现小憨这种知其然不知其所以然的尴尬，我们还是有必要来分析下上述问题的。

客官，且看下文

我们都知道HashSet存放的元素是不允许重复的，那么HashSet又是是如何保证元素不可重复的，你知道吗？

先看段源码

public class HashSet
    extends AbstractSet
    implements Set, Cloneable, java.io.Serializable
{
    static final long serialVersionUID = -5024744406713321676L;

    private transient HashMap map;

    private static final Object PRESENT = new Object();

    public HashSet() {
        map = new HashMap<>();
    }

    
    public HashSet(Collection<? extends E> c) {
        map = new HashMap<>(Math.max((int) (c.size()/.75f) + 1, 16));
        addAll(c);
    }

    
    public HashSet(int initialCapacity, float loadFactor) {
        map = new HashMap<>(initialCapacity, loadFactor);
    }
}

乍一看这段代码，哎呦我去，new HashSet()操作不就不是维护了一个HashMap嘛，要是这么往下演的话，我觉得我这点功力也能看个大概呀！

诸位同仁，咱接着往下看

public boolean add(E e) {
    return map.put(e, PRESENT)==null;
}

什么，这不就是map操作么，瞬间我来个下饭推理；

Map中的key是不允许重复的，而你HashSet正好利用我Map中key不重复的特性来校验重复元素，妙哉妙哉。

确实，HashSet确实是利用Map的这一特性实现了元素的不重复特性，但是我们再来深挖一下，Map他又是如何来保证key不重复的呢？

与其说这篇文章是介绍HashSet如何保证元素不重复的，倒不如说Map是如何保证Key不重复的。

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
                   boolean evict) {
        Node[] tab; Node p; int n, i;
        if ((tab = table) == null || (n = tab.length) == 0)
            n = (tab = resize()).length;
            
        // 1、如果该位置不存在，直接插入
        if ((p = tab[i = (n - 1) & hash]) == null)
            tab[i] = newNode(hash, key, value, null);
        else {
            Node e; K k;
            // 2、如果存在，判断是否是重复元素
            if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;
            else if (p instanceof TreeNode)
                e = ((TreeNode)p).putTreeVal(this, tab, hash, key, value);
            else {
                for (int binCount = 0; ; ++binCount) {
                    if ((e = p.next) == null) {
                        p.next = newNode(hash, key, value, null);
                        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                            treeifyBin(tab, hash);
                        break;
                    }
                    if (e.hash == hash &&
                        ((k = e.key) == key || (key != null && key.equals(k))))
                        break;
                    p = e;
                }
            }
            if (e != null) { // existing mapping for key
                V oldValue = e.value;
                if (!onlyIfAbsent || oldValue == null)
                    e.value = value;
                afterNodeAccess(e);
                return oldValue;
            }
        }
        ++modCount;
        if (++size > threshold)
            resize();
        afterNodeInsertion(evict);
        return null;
    }

上面部分我重点圈了两段代码，分别是1和2。

第一段

if ((p = tab[i = (n - 1) & hash]) == null)

这段代码其实主要是通过hash计算该元素的位置，然后判断该位置是否有值，如果没有值，那么可以直接插入，最后返回null；

第二段

if (p.hash == hash &&
                ((k = p.key) == key || (key != null && key.equals(k))))
                e = p;

如果通过计算，该位置上已经有其他元素，那么接下来就会通过hash和equals进行判断，判断它是不是重复元素，如果重复元素，那么最后会将这个重复元素返回。

通过第二段代码我们可以发现，判断元素是否重复，使用的是hash和equals方法进行判断的，所有我们Set里面如果存放的是对象，那么一定要重写hash和equals方法。

现在是不是很清晰了，为啥要重写equals方法了，不会出现那么诡异的代码了，这两个对象值都一样啊，为什么Set没去重呢！

展开阅读全文

页面更新：2024-03-04

标签：同仁不允许重写源码特性元素确实对象位置代码方法

1 2 3 4 5

与全球400多家银行合作，打通16个币种！义乌有了自己的全球支付渠道

2月20日上午，在义乌首个新能源产品市场，由小商品城（股票代码：600415）全力打造的支付平台——Yiwu Pay义支付（以下简称：Yiwu Pay)正式亮相发布。这标志着全球最大的小商品集散中心拥有了自己的全球支付渠道，助力义乌90多万市场

“禁售油车”已成定局，欧洲率先通过法案！

尽管不少人认为，在充电设施不够多且技术有待完善的情况下，冒然停售燃油车并非一个好的选择，但在最近两年，新能源汽车市场快速增长的大背景下，业内有关“禁售燃油车”的呼声也越来越高，甚至在欧洲“停售燃油车”的相关政策已

亚马逊CEO呼吁员工重返办公室：要求一周到岗3天

【环球网科技综合报道】2月20日消息，亚马逊首席执行官安迪·贾西 (Andy Jassy)日前在一份公司备忘录中提出，亚马逊正在要求员工每周至少到办公室工作三天。安迪·贾西表示，此举将于今年的5月1日生效，并称面对面办公将使员

科创新城再领春潮｜东莞理工王艺：与城市“同频”，培育人工智能生力军

“人工智能已经是发展数字化的普用手段，但一项新技术的到来势必存在两面性。”去年九月，在松山湖数字经济促进人才项目高质量发展沙龙上，东莞理工学院教授、人工智能安全团队负责人王艺围绕人工智能的安全和风险研究话题

海报丨揭秘全国首个“量子手术”背后的机器人医生

（大众日报客户端记者李丽徐晨徐佳李洪翠设计张海飞策划李艳）

新手司机买纯电SUV，飞凡R7与Model Y，谁更适合？这次说清楚了

作为一位纯电SUV的潜在车主，也是一位90后新手司机，在面对如今产品众多的纯电SUV，起初的确不太好确定自己的目标车型，不过买车毕竟是件大事儿，我梳理了自己的需求，买车层面就是预算，定在30万级别，一般情况下30万级的车型产品力

数字农业及农业大数据决策系统

南京绿色科技研究院有限公司是一家以“信息改变农业，让数据创造价值”为核心使命，专业从事农业大数据挖掘分析服务的高新技术企业，公司在AI+农业、农业病虫害知识图谱、农业病虫害拍照智能识别诊断、农业碳汇大数据平台

给人工智能chatgpt改关于消费维权的作业

原来教学比较随意，学习完考试问题也是不固定，前几天心血来潮出了套统一试题，除了几个学员做了试题，我也通过朋友问了最近大火的chatgpt，给出的答案五花八门，特别是后面几个法条，就是网友说的一本正经的“胡说八道”。看来人

Facebook广告海外户怎么样？

Facebook目前依然是跨境玩家获取流量和订单的一个主流的渠道，但是基本上做Facebook广告的朋友都绝对经历过Facebook“被封”的铁拳。这不仅仅是因为你的广告和产品有可能触碰到了一些Facebook的广告政策，也有可能因为Fa

Blazor入门100天 : 身份验证和授权 (5) - 本地化资源

目录建立默认带身份验证 Blazor 程序角色/组件/特性/过程逻辑DB 改 Sqlite将自定义字段添加到用户表脚手架拉取IDS文件,本地化资源freesql 生成实体类,freesql 管理ids数据表初始化 Roles,freesql 外键 => 导航属性完

日系电动车价格集体“大跳水”！比部分自主还便宜，还值得买么？

最近几天，日系纯电阵营价格体系已经出现了“土崩瓦解”。2月9日，广汽丰田率先官宣bZ4X限时直降3万，降价后限时售价区间为16.98-25.48万元；紧接着，一汽丰田的部分经销商更是推出了限时优惠6万的政策，如果全系降价，那么售价区

展望2023：值得关注的十大网络安全趋势

又是网络安全动荡的一年。复杂多变的国际局势加剧了国家间的数字冲突。加密货币市场崩溃，数十亿美元从投资者手中被盗。黑客入侵科技巨头，勒索软件继续肆虐众多行业。信息安全传媒集团（Information Security Media Group

历代骁龙8系口碑现状：一半翻车，一半神U！

处理器是手机最核心的元器件，虽然买手机不能只看处理器，还要看运存、闪存、相机、屏幕等硬件。但是说到底，处理器全面决定了一台手机的下限。“手机唯芯片论”可能有些片面，但一定不会让你吃亏。遇到好芯片，哪怕是外观平平

JUC(7) : JMM & Volatile - 死磕内存模型

前言1、你知道什么是 Java 内存模型 JMM 吗2、JMM 与 Volatile 它们两个之间的关系？3、JMM 有哪些特性 or 它的三大特性是什么？4、为什么要有 JMM，它为什么出现？作用和功能是什么？5、happens-before 先行发生原则你有了解

Python如何将C++结构体数据保存为二进制文件

前言如题所述，本文将介绍 Python 和 C++ 之间的数据交互问题。我们的目标是，在 Python 中将结构性数据保存为二进制文件，然后在 C++ 中将二进制文件数据加载到结构体，直接就可以使用，不需要再进行其他的数据转换。在 Pytho

上滑加载更多 ↓

通过源码探查HashSet究竟是如何保证唯一性的

与全球400多家银行合作，打通16个币种！义乌有了自己的全球支付渠道

“禁售油车”已成定局，欧洲率先通过法案！

亚马逊CEO呼吁员工重返办公室：要求一周到岗3天

科创新城再领春潮｜东莞理工王艺：与城市“同频”，培育人工智能生力军

海报丨揭秘全国首个“量子手术”背后的机器人医生

新手司机买纯电SUV，飞凡R7与Model Y，谁更适合？这次说清楚了

数字农业及农业大数据决策系统

给人工智能chatgpt改关于消费维权的作业

Facebook广告海外户怎么样？

Blazor入门100天 : 身份验证和授权 (5) - 本地化资源

日系电动车价格集体“大跳水”！比部分自主还便宜，还值得买么？

展望2023：值得关注的十大网络安全趋势

历代骁龙8系口碑现状：一半翻车，一半神U！

JUC(7) : JMM & Volatile - 死磕内存模型

Python如何将C++结构体数据保存为二进制文件

「必看」信用卡怎么提升额度最快？这几个方法你一定要知

跨国企业在中国丨上海乐高乐园：目标2024年内开门迎客！这

南京同仁堂面膜检出禁用激素，老字号品牌价值已严重“透

微信新增“打车”入口，提升聊天位置出行转化

你还在用力放屁？你的肝就快要受伤了，快用这个方法挽救你

数据库优化这些方法你都知道么

劲爆！iOS 15.4.1 ra1ncloud 已发布，确实能越狱

微软 New Bing申请使用方法

Linux源码学习笔记day5 内存0地址处放的都是些什么玩

国产手机格局发生明显改变，主导位置从华为+小米变成viv