标题 | 简介 | 类型 | 公开时间 | ||||||||||
|
|||||||||||||
|
|||||||||||||
详情 | |||||||||||||
[SAFE-ID: JIWO-2025-2745] 作者: Taber 发表于: [2020-09-01]
本文共 [511] 位读者顶过
CenturyLink的一个BGP路由错误已引起整个互联网出现连锁反应,导致无数与互联网连接的服务瘫痪,比如Cloudflare、AWS、Garmin、Steam、Discord和Blizzard等众多服务。这些故障从美国东部标准时间上午6点左右开始,当时客户们开始报告美国发生了影响CenturyLink服务的大规模故障。
![]() ![]() ![]() ![]() BGP路由问题导致故障据受影响客户的无数报告显示,今天的问题是CenturyLink的BGP路由问题引起的,CenturyLink的路由没有正确地传输互联网的一些部分。为了使互联网正常运行,互联网服务提供商(ISP)、数据中心和网络提供商通过BGP路由协议来通告它们路由和管理的IP地址。由于这主要是一种基于信任的系统,大型ISP开始通告它们并不管理的IP地址范围的路由时,会导致全球性故障和性能问题。CenturyLink似乎在BGP路由方面犯了一个错误,从而导致了当今的大范围故障。![]() ![]() 2020年8月30日10点04分GMT,CenturyLink发现一个问题影响多个市场的用户。IP网络操作中心(NOC)参与其中,初步研究发现,一个存在问题的flowspec通告阻止边界网关协议(BGP)跨整个CenturyLink网络的多个网络单元建立起来。IP NOC部署了全局配置变更,以阻止存在问题的flowspec通告,这让BGP得以开始正确建立起来。变更实施到整个网络中后,IP NOC观察到引发警报的所有相关服务解除警报、服务回到稳定状态。 [出自:jiwo.org] CenturyLink中断导致全球Web流量下降了3.5%。 |