混进iOS 14.3！网友爆出苹果CSAM检测技术出现哈希冲突

来源：Reddit

编辑：Priscilla 好困

【新智元导读】苹果计划推出在iOS 15中应用的CSAM检测系统备受争议。近日，一位Reddit用户发现CSAM算法竟被悄悄地「埋在了」iOS 14.3里。而算法公开几小时后，一位英特尔实验室的研究员就发现了其存在的缺陷：哈希冲突。

苹果偷偷将CSAM检测技术算法放进iOS14.3里！

前段时间，苹果宣布计划推出CSAM检测技术，能够扫描所有存储在iCloud上的照片，找出符合虐待儿童、儿童色情内容的照片（CSAM）。

该功能本该在今年9-10月份上线，却被Reddit网友发现CSAM检测技术的算法NeuralHash已经混进了现在的系统里。

即便苹果的初衷是好的，但在大多数人眼里，苹果是在监视用户的一举一动。

新闻一发布，GitHub上就有超过6000多家组织和个人签署联名信，强烈谴责苹果这项侵犯个人隐私的新技术。

而德国有关部门也致信库克，希望苹果能够重新考虑CSAM检测计划。

但现在苹果却想要试图蒙混过关了吗？！

网友发现算法早已存在

昨日，Reddit用户AsuharietYgvar表示：

在iOS 14.3里，NeuralHash就已经隐藏在混淆类名里了。

Ygvar对隐藏的API进行了一些挖掘和逆向工程，成功将MobileNetV3模型导出到ONNX。

还在Python中重建了整个NeuralHash算法，甚至可以在Linux上测试NeuralHash。

苹果的NeuralHash是一种基于神经网络的图像感知哈希方法，并且可以不受对图像大小的调整和压缩的影响。

https://github.com/AsuharietYgvar/AppleNeuralHash2ONNX

哈希算法的步骤：

将图像转换为RGB。
调整图像大小为360x360。
将RGB值归一化为[-1, 1]范围。
对NeuralHash模型进行推理。
计算96x128矩阵与所产生的128个浮点的向量的点积。
对产生的96个浮点数向量应用二进制步骤。
将1.0和0.0的向量转换为比特，得到96位二进制数据。

AsuharietYgvar则列举了这就是苹果所采用的算法的证据。

首先，模型文件的前缀是NeuralHashv3b-，与苹果的文件中的术语相同。

（https://www.apple.com/child-safety/pdf/CSAM_Detection_Technical_Summary.pdf）

其次，苹果对算法描述的细节也与Ygvar的发现相同：

「第二，描述符被传递到一个哈希方案，将N个浮点数转换为M位。这里，M远远小于这里，M远远小于表示N个浮点数所需的比特数。」

从下面这两段代码中可以看到，N=128，M=96。

此外，如果调整图片的大小或压缩图片，这个脚本产生的哈希值几乎没有变化，这又和苹果的文件中描述的一样。

值得注意的是，不同设备生成的哈希值会有几位的差异。

这是由于神经网络基于浮点计算，精度在很大程度上取决于硬件。

对于NeuralHash这种有200多层的网络来说，会导致大量的累积误差。

哈希冲突

公开代码后的短短几小时内，英特尔实验室的研究人员Cory Cornelius就发现了两张毫无关联的照片竟然有一样的哈希值！

$ python3 nnhash.py NeuralHash/model.onnx neuralhash_128x96_seed1.dat beagle360.png

59a34eabe31910abfb06f308

$ python3 nnhash.py NeuralHash/model.onnx neuralhash_128x96_seed1.dat collision.png

59a34eabe31910abfb06f308

哈希值同为59a34eabe31910abfb06f308

随后AsuharietYgvar也证实了这个发现。

哈希是将任意长度的数据映射到有限长度的域上，并使输出作为这段数据的特征。

同时，哈希算法所计算出来的哈希值（Hash Value）具有不可逆（无法逆向演算回原本的数值）的性质。

通常来说，哈希算法具有以下特点：

相同的输入一定得到相同的输出；
不同的输入大概率得到不同的输出。

但是由于通过哈希函数产生的哈希值是有限的，当输入数据量达到一定的程度时，就会导致不同的数据在经过哈希函数处理之后产生相同的值。

这也就产生了哈希冲突。

然而，早在8月8日，有技术人员就指出，NCMEC采用的PhotoDNA感知哈希算法存在缺陷。

也就是说，如果有人利用被NCMEC标注的图片的哈希值改变其他图片，那么任何存储这些图片的人都将拥有儿童色情制品。

https://www.hackerfactor.com/blog/index.php?/archives/929-One-Bad-Apple.html

微软表示「PhotoDNA的哈希值是不可逆的」。

https://www.microsoft.com/en-us/photodna

而实际上，PhotoDNA哈希值可以投射到26x26的灰度图像中，只是有点模糊，但细节足以识别人和物。

而且逆向PhotoDNA哈希值并不比解开26x26的数独题更复杂，这是一项非常适合计算机的任务。

同样，Cory Cornelius发现苹果的NeuralHash也能被同样的手法欺骗。

利用模型得到狗图像的哈希值，然后让模型去改变灰度图像，使其输出与狗图像相同的哈希值。

根据鸽巢原理可知，这是一个第二次原像攻击问题。

对此，加州大学伯克利分校的高级研究员Nicholas Weaver表示：「这只是用一些垃圾图像骚扰苹果的响应团队而已」。

而SIXGEN公司网络产品总监Ryan Duff说：「看起来苹果的算法相当容易受到原像攻击」。

解释？狡辩？

苹果在一份白皮书中解释，CSAM检测技术将在用户的设备上运行。

检测技术会扫描用户上传到iCloud上的照片，将图像转换成哈希值后，与已知CSAM照片的哈希数据库进行比对。

如果两者哈希值匹配次数超过30次，系统就会标记这个图像，由团队审查。

而英特尔实验室研究人员发现两张图片哈希值相同后，苹果作出的解释是：

GitHub分析的版本只是一个通用版本。

如果照片30次的哈希值比对都一样，CSAM检测技术还有另一个非公开的算法。

「非CSAM图像被对抗性干扰，令NeuralHash与设备上加密但CSAM数据库相匹配，导致超过了匹配阈值，这个可能性很低，但这个独立的哈希就是为了避免出现这种可能性。」

照这么说，Ygvar逆向出来的代码发生哈希冲突也没有关系，苹果还有「双保险」。

但是，苹果似乎没有get到重点：

CSAM检测技术已经悄悄地安排上了。

参考资料：

https://www.reddit.com/r/MachineLearning/comments/p6hsoh/p_appleneuralhash2onnx_reverseengineered_apple/

https://github.com/AsuharietYgvar/AppleNeuralHash2ONNX

展开阅读全文

页面更新：2024-03-06

标签：冲突英特尔苹果神经网络浮点灰度向量算法模型图像发现照片网友数据用户

1 2 3 4 5

一个源自高中生的算法「y-cruncher」让圆周率的精度再破世界纪录

来源：FHGR编辑：Priscilla 好困【新智元导读】近日，瑞士格劳宾登应用科学大学团队历时101天9小时，完成了圆周率小数点后62.8万亿位的计算，比创下吉尼斯纪录耗费的计算时间减少一半！诞生如此多位小数的算法「y-cruncher」竟出

港科大准博士被锤剽窃，杜克大学陈怡然教授呼吁谨守学术红线

来源：网络编辑：Priscilla 好困【新智元导读】港科大准博士ICCV论文被「锤」抄袭，ICML论文二作、三作在推特上列出详实证据，引起轩然大波，当事人李某发文致歉。我们有幸采访了杜克大学陈怡然教授，他呼吁后人能够引以为鉴。

31岁企业家驾驶蔚来ES8车祸身亡！网友热议：NOP是不是自动驾驶？

来源：网络编辑：Isabel、su【新智元导读】2021年8月12日下午2时许，31岁企业家林文钦驾驶蔚来ES8汽车并启用自动驾驶功能后，在沈海高速公路涵江路段发生交通事故不幸离世，终年31岁。自动驾驶再被推上风口浪尖，针对这起事故，蔚

塔利班扣押美国军事生物识别设备！多家社交媒体保护阿富汗公民

来源：网络编辑：小匀、su【新智元导读】这个时代，没有什么战争只是一场单纯的武装与斗争。阿富汗局势严峻。据美媒The Intercept报道，上周，塔利班扣押了美国用于识别协助联军的阿富汗人的「军事生物识别设备」。不仅如

中国首次！2021年图计算挑战赛揭榜，华中科技大团队夺冠

来源：graphchallenge编辑：Priscilla 好困【新智元导读】8月13日，图计算领域最具影响力的国际赛事之一「Graph Challeng 2021」公布比赛结果，华中科技大学团队斩获冠军，成为该赛事中首支夺冠的国内团队！此外，该校另一支团队也

国庆巨献：12款旗舰手机《原神》横向评测

9月28号，万众瞩目（不管是褒义还是贬义）的《原神》手机端公测了，作为一款打通安卓、IOS和PC的开放式世界游戏自然会引起玩家们的目光，但是你的手机真的能吃得消这款游戏吗？于是本着节前要努力工作（开心摸鱼）的态度，我们选择

这次 DXOMARK 又双叒叕提出了手机评测的哪些新基准

关注手机拍照评测的网友对 DXOMARK 绝对不会陌生。而在今天，DXOMARK 不仅宣布将扩展后置摄像头的测试基准，还将引入针对智能手机屏幕的评测。过去几年，智能手机在拍照领域进步斐然，所以 DXOMARK 对手机摄像头的评测基准

科技春晚过后，本周一样热闹 | 买微力新鲜报

买微力新鲜报，带你看遍本周新鲜资讯。小米：上周二，小米首款真无线主动降噪耳机 Air 2 Pro发布。这款耳机采用了双反馈主动降噪方案，重点提升了高频噪音的降噪性能。后续，Air 2 Pro还会通过 OTA 支持超低延迟的 LHDC 3.0

聊聊手机上使用的防抖技术

本周三早上一点，苹果发布了 iPhone 12 系列，在发布会后，不乏有网友希望我们来详细讲解一下 iPhone 12 Pro Max 上首发的传感器位移式光学图像防抖究竟是个什么玩意儿。所以我们这次就从最基础的传统电子防抖出发，以时间为

索尼电视的实力：有官方回应还有4K120FPS HDR首秀

凭借X1 芯片和从采集到放映全流程解决方案，索尼电视一直堪称电视领域的王者，也常常成为不少新老品牌竞相参考、比较的对象，但这种对标有时候也会给消费者带来一些疑惑。在昨天举行的索尼电视2020秋季媒体体验会上，索尼电

长假过后好热闹 | 买微力新鲜报

买微力新鲜报，带你看遍本月新鲜资讯。没错，虽说买微力新鲜报每周一更新，但是谁也说不准咱报道的是上周的新闻，这周的新闻，还是这个月的新闻哦…… Nokia：上周六，诺基亚手机在中国首发了两台功能机，Nokia 215 4G 以及 Nokia 2

vivo WATCH：不仅是精致的智能手表更是精致的生活方式

传闻已久的vivo WATCH已于日前正式发布。和往常一样，我们得以提前体验到这款产品。先说结论：和之前体验过的其他国产手机厂商做的智能手表相比，vivo WATCH最大的不同在于——精致。更确切地说，vivo WATCH不仅是一款精致的

开启万物互融新生态 OPPO 发布多款IoT新品

北京时间昨天晚上，OPPO在上海举办了今年第一场线下新品发布会——OPPO智美生活发布会。本次发布会以“One More Step 步入新境”为主题，同时也是OPPO IoT生态的首场发布会。发布会上，OPPO不仅发布了OPPO智能电视S1和OP

iQOO 5 Pro传奇版

iQOO 5 Pro采用了120Hz的超视感3D曲面屏，搭载了120W超快闪充，并且把后置摄像头模组中的13MP人像镜头换成了8MP的5X光学超长焦镜头。视频加载中... iQOO 5 Pro传奇版的背盖主体采用了纯白色设计，材质则为素皮，摸起来少了

既有“底气”又接“地气”写在柔宇FlexPai 2发布会后

记得8月中旬的时候，柔宇邀请我作为科技媒体代表前往他们位于深圳的国际柔性显示基地参观。遗憾的是由于当时我还在外地出差，只能请同事@MyWishList买微力的主编之瀾老师代替我参加活动。当行程结束后，之瀾老师颇为激动

上滑加载更多 ↓

混进iOS 14.3！网友爆出苹果CSAM检测技术出现哈希冲突

【新智元导读】苹果计划推出在iOS 15中应用的CSAM检测系统备受争议。近日，一位Reddit用户发现CSAM算法竟被悄悄地「埋在了」iOS 14.3里。而算法公开几小时后，一位英特尔实验室的研究员就发现了其存在的缺陷：哈希冲突。

网友发现算法早已存在

哈希冲突

解释？狡辩？

一个源自高中生的算法「y-cruncher」让圆周率的精度再破世界纪录

港科大准博士被锤剽窃，杜克大学陈怡然教授呼吁谨守学术红线

31岁企业家驾驶蔚来ES8车祸身亡！网友热议：NOP是不是自动驾驶？

塔利班扣押美国军事生物识别设备！多家社交媒体保护阿富汗公民

中国首次！2021年图计算挑战赛揭榜，华中科技大团队夺冠

国庆巨献：12款旗舰手机《原神》横向评测

这次 DXOMARK 又双叒叕提出了手机评测的哪些新基准

科技春晚过后，本周一样热闹 | 买微力新鲜报

聊聊手机上使用的防抖技术

索尼电视的实力：有官方回应还有4K120FPS HDR首秀

长假过后好热闹 | 买微力新鲜报

vivo WATCH：不仅是精致的智能手表更是精致的生活方式

开启万物互融新生态 OPPO 发布多款IoT新品

iQOO 5 Pro传奇版

既有“底气”又接“地气”写在柔宇FlexPai 2发布会后

一个源自高中生的算法「y-cruncher」让圆周率的精度再

31岁企业家驾驶蔚来ES8车祸身亡！网友热议：NOP是不是自动

英特尔首款大小核处理器即将上市！显卡AI超级采样，台积电

Transformer走下神坛？想解决常识问题，神经网络不是答案

显卡能烧水！玩家在RTX 3090公版显卡中竟发现了一个指套

90后斯坦福博士论文登Science封面！AI算法准确预测RNA三

一行预处理代码，让你的CV模型更强

支持口罩解锁！苹果测试新一代面容ID，眼镜起雾也不怕

首个！7nm世界最大芯片打造AI集群，解锁120万亿「大脑级」

vivo 将发布新系统、苹果发布新电脑 | 买微力新鲜报