Cloudflare网路故障27分钟影响Discord与Shopify等服务

人工智能2021-02-12 12:02:11
最佳答案

Cloudflare在台湾时间7月18日凌晨,由于人为配置错误,使得骨干网路流量出现异常,冲击Cloudflare网路服务,导致诸如Shopify与Discord等知名服务受到影响,这个问题持续了27分钟,Cloudflare整个网路流量下降50%,Cloudflare在早上6点10分修复问题,所有网路流量恢复正常。

Cloudflare骨干网路连接着Cloudflare散布全球的资料中心,骨干网路是专用的线路,可让资料中心间的资料传输,不需要经过公共网际网路,如此带来的好处,不只使Cloudflare资料中心间的通讯,更快也更可靠,而且Cloudflare能够良好地控制路由网际网路流量的位置与方法。

这个事件发生的起始,是由于Cloudflare在纽瓦克和芝加哥间的骨干网路连接出现问题,导致他们亚特兰大到华盛顿特区间的骨干网路壅塞,因此他们决定更新亚特兰大路由配置,移走部分流往亚特兰大骨干网路的流量,以减轻壅塞的情况。

但是配置却出现错误,原本应该从骨干网路移除亚特兰大路由,但是却错误变更了线路,使得所有BGP路由灌进了Cloudflare骨干网路中,且因为演算法的关係,所有Cloudflare骨干流量都被导向亚特兰大,亚特兰大路由器因此不堪负荷,使得连接到骨干网路的Cloudflare网路位置发生错误。

受影响的地区从美洲跨到了欧洲,包括圣荷西、达拉斯、西雅图、芝加哥、华盛顿特区、伦敦、阿姆斯特丹、巴黎、斯德哥尔摩、圣彼得堡和莫斯科等地区,而其他地区服务则维持正常。

当下问题发生时,Cloudflare立刻隔离了亚特兰大路由器,并关闭骨干网路,转而将流量跨网路服务供应商路由,使网路服务恢复正常。Cloudflare迅速地在问题发生后约3小时,发布完整的调查报告,并强调这个错误并非由任何形式的攻击造成,而是配置错误导致,他们已经对骨干网路进行适当的调整,避免之后还有类似情形发生。

免责声明:本文由用户上传,如有侵权请联系删除!