“互联网的黑暗魔法”让 Facebook 屈服

“互联网的黑暗魔法”让 Facebook 屈服

周一,Facebook 及其所有附属公司和服务突然从网络上消失了——中断持续了五个多小时,导致用户无法访问他们的 FB、WhatsApp 或 Instagram 帐户。谣言和阴谋论很快就散播开来,称这家社交媒体巨头遭到了黑客攻击。

好吧,现在我们知道真正的原因了:周二,该公司发布了一份声明,提供了有关停电的更多细节,并解释说整个全球停电是由日常维护过程中发出的“错误配置更改”引发的。该错误配置意外关闭了 Facebook 的骨干网,该骨干网是全球分布的光纤电缆网络,负责连接公司在全球的所有数据中心。因此,这家备受诟病的社交媒体巨头在一天的大部分时间里都从互联网上消失了——让我们所有人都摆脱了它的毒害。

当然,发生的事情的细节比这要复杂得多。整个过程中一个特别有趣的方面是一种称为边界网关协议或“BGP”的强大但鲜为人知的路由协议所扮演的角色。网络专家广泛推测——现在 Facebook 证实了这一点——BGP 帮助推动了整个事件。是的。BGP是什么鬼?


BGP,解释

它被称为将网固定在一起的“胶水”。其他人将其称为互联网的“邮局”或“空中交通管制员”。当Facebook掉下来的地球上周一的脸,条纹首席执行官Patrick科里森提到到BGP作为-a复杂的机构“互联网的黑暗魔法”,“没有任何人完全理解。” 实际上,BGP 有一个基本的、直接的功能,但是,要理解它,您必须考虑 Web 实际工作方式的大致范围——诚然,这非常复杂。

而言之,BGP 是众多协议中的一种,有助于为构成 Web 的大量互锁网络带来秩序。具体来说,BGP 帮助路由进出最大的在线实体(即所谓的“自治系统”)的流量。AS 基本上是大型网络或网络组的简写:它可以是一所大学、一个 ISP、一个政府机构,或者除其他外,一个非常大的科技公司(如 Facebook)。自治系统负责保持有关最快网络路由的最新信息,数据包可以通过这些路由传入和传出其网络。这些策略随后使用 BGP 传达到更广泛的网络(并因此传达给其他网络)。从这个意义上讲,BGP 基本上实现了 Web 上的数据路由。

这就是“邮局”比喻的用武之地。BGP 负责查找和共享最有效的路由,以从特定目的地来回中继数据(如邮件)。其他人将其称为地图——它会根据互联网的波动情况不断变化和更新。在另一个启发性的比喻中,安全公司 Imperva 的一项分析将 BGP 与您汽车的 GPS 系统进行了比较:

...BGP 路由协议类似于您可信赖的 GPS 导航器。与谷歌的 Waze 应用程序一样,最佳路线由不同因素决定,例如交通拥堵、道路暂时关闭以进行维护等。根据网络节点的情况动态计算路径,就像 GPS 上的道路和路口地图。

关于 BGP 还有很多可以说的,但简短的故事是这样的:如果自治系统没有正确配置其 BGP,则数据无法有效地进出其网络,因此人们不能达到它。这显然是 Facebook 发生的事情的一部分。

BGP 与 Facebook 非常糟糕的一天有何关系

从历史上看,BGP 错误配置会导致“大规模中断的壮观事件”,切断用户对在线服务的访问。Facebook 现在已经在其最糟糕的日子里应对了 BGP 的角色,在其最近的更新中解释了其骨干问题如何导致其 BGP “广告” - 本质上是指向它存在于网络上的其他在线实体的机制:

为确保可靠运行,如果我们的 DNS 服务器本身无法与我们的数据中心通信,则会禁用这些 BGP 广告,因为这表明网络连接不健康。在最近的中断中,整个主干网都停止运行,使这些位置宣布自己不健康并撤回那些 BGP 广告。最终结果是我们的 DNS 服务器无法访问,即使它们仍在运行。这使得互联网的其余部分无法找到我们的服务器。

值得注意的是,禁用 Facebook 的 BGP 广告只是更大、更系统性错误的副作用。然而,该事件仍然说明了该协议在 Web 功能中的关键作用,同时也回顾了其他事件,其中 BGP 的失效或配置错误将事情大规模地搞砸了。

Cloudflare 工程高级副总裁 Usman Muzaffar 在周一与 Gizmodo 分享的一份声明中说:“根据我们的经验,这些通常是错误,而不是攻击。” 据专家称,这种中断并不是一个完全异常的事件——尽管 Facebook 中断的规模和持续时间值得注意。Cloudflare 已经对 BGP 错误配置可能如何发生进行了自己的细分。

“这并不奇怪,”Electronic Frontier Foundation 的高级技术专家 Jacob Hoffman-Andrews 说。“大型科技巨头经常出现这样的中断,”他说,并指出2008 年发生的一起特别臭名昭著的 BGP 事件,当时巴基斯坦的国有电信公司设法通过选择用于视频的流量意外地将 YouTube 从互联网上启动——共享平台。在2018 年的类似事件中,在 BGP 故障将大量网络流量路由到俄罗斯、中国和其他不应该出现的地区后,谷歌的很大一部分宕机了大约一个小时。

这样的事情还会发生吗?

简短的回答:是的。绝对是的。如果不是 Facebook,BGP 几乎肯定会在绊倒您经常使用的另一个主要平台方面发挥作用。据专家称,这不是值得警惕的原因——但它是网络易出错本质的一个很好的例子,说明了公司的技术错误等简单的事情可以破坏多少网络。

“今天的事件温和地提醒人们,互联网是一个非常复杂且相互依赖的系统,由数百万个系统和协议协同工作,”Cloudflare 分析师在他们关于该事件的文章中说。“实体之间的信任、标准化和合作是使其为全球近 50 亿活跃用户服务的核心。”

展开阅读全文

页面更新:2024-05-21

标签:在线   路由   巨头   实体   黑暗   事情   协议   错误   发生   事件   服务器   数据   广告   数码   魔法   系统   公司   网络

1 2 3 4 5

上滑加载更多 ↓
推荐阅读:
友情链接:
更多:

本站资料均由网友自行发布提供,仅用于学习交流。如有版权问题,请与我联系,QQ:4156828  

© CopyRight 2020-2024 All Rights Reserved. Powered By 71396.com 闽ICP备11008920号-4
闽公网安备35020302034903号

Top