Cloud周报第29期:软体更新配置错误导致Cloudflare全球大当机

互联网2021-02-21 14:06:10
最佳答案Cloudflare于7月2日下午,因软体定期更新作业,发生配置错误,造成大当机

Cloudflare于7月2日下午,因软体定期更新作业,发生配置错误,造成大当机,使得许多採用Cloudflare的网站或服务,出现502错误的状况,约持续了27分钟。

重点新闻(2019/06/13~2019/07/03)

  Cloudflare     当机     脸书    Amazon   

提供内容递送网路、DDoS缓解服务与DNS服务的Cloudflare,继在世界协调时间6月24日,发生流量中断事件,又于7月2日下午,发生大当机。根据Cloudflare当机原因报告,此次当机是因软体定期更新作业,发生配置错误,而引发的意外。该当机事件造成许多採用Cloudflare的网站或服务,出现502错误的状况,约持续了27分钟,虽然当机时间不长,但全球都有灾情传出,因Cloudflare的流量最高曾下滑超过8成。

Cloudflare说明,意外发生后,约花了20分钟釐清问题的原因,发现会定期更新的网路应用程式防火墙规则中,有规则所含的正规表示式,造成自身全球伺服器的CPU使用率冲达百分百,导致CPU衰竭。Cloudflare也坦言,此次意外是因测试步骤不够周延,当下,决定移除全球伺服器上的WAF规则集,才得以让流量恢复正常。为避免再发生类似意外,Cloudflare计画同时变更测试及部署程序。(详全文)

  金管会     金融业     云端服务   

金管会开放金融机构上云端!

金管会于6月27日宣布,已拟具「金融机构作业委託他人处理内部作业制度及程序办法」(委外办法)部分条文修正草案,将依照行政程序法规定,于近日预告,徵求各方意见。金管会表示,参考各国对金融机构委託他人处理作业涉及云端服务的规範后,决定以循序渐进开放之原则,修订委外办法。从今年3月以来,金管会召开了两次公听会,邀集央行、银行公会、信联社、20家金融业者,还有6家科技业者,以及相关公协会代表,就草案内容进行讨论,达成了共识。

金融机构将作业委託他人处理,涉及使用云端服务时,必须遵循八大项规定办法,首先,应评估委託业者的作业风险,採取适当风险管控措施,再者,对云端业者负有最终监督义务,第三项,确保自身、主管机关等,具有资讯取得和实地查核权利,第四项,自行委託或与其他机构联合委託具资讯专业的独立第三人查核,第五项,为客户资料传输和储存订定资安控管机制,第六项,保有委外处理资料的完整所有权,第七项,订定紧急应变及退场机制,最后,如资料储存地于境外,须保指定资料处理及储存地的权利,还有当地资料保护法规不得低于我国要求,及客户重要资料要在境内有备份。(详全文)

  Slack     伺服器当机   

Slack因伺服器当机,服务不稳逾15小时

聊天协作程式Slack在太平洋时间6月28日清晨,发生讯息传递延迟或错误,而该问题持续了逾15个小时。受影响的用户不仅遇到讯息传递延迟的状况,连通知、连结展开或张贴讯息等作业,都有延迟或出现错误的问题。根据Slack的说明,是因数个伺服器当机,无法运作,造成任务处理系统的效能下降,影响1到2成5的任务。虽然Slack在5个小时后,全面修复讯息传递功能,也将错误率降低至5%,但是,系统紧接着在下午又再度发生问题,使伺服器出现过载的状况,因而大量用户的连线遭到中断,且重新连结又加重了负载,一直到当晚服务才全面恢复正常。依据监控网站Downdetector所收到的使用者报告,美国、日本及巴西等多国都有用户受影响。(详全文)

  台湾大哥大     台中     资料中心     云端   

台哥大启用台中新机房,就近云端服务

台湾大哥大于7月1日正式启用,位于台中的新资料中心。台哥大表示,因中南部多数机房代管空间,接近满载,而在AI时代,机房用量遽增,此机房是为因应日后庞大的需求量。

历时2年规画与建置,台哥大表示,该资料中心的机电、备援机制皆参照云端IDC机房作法。而且设计团队运用通过Uptime Tier III认证的技术,与设计国网中心运算机房的经验,来兴建该机房,所以当市电断电情况发生时,该机房的发电系统可提供持续365天的电源,另外,该机房与台北机房有相同的维运团队。此外,新机房具备可同时维修性,换句话说,即使机房在进行维修或扩建工程,也不会影响机房运转,服务不会中断。(详全文)

  远传     微软     云端战略合作   

远传与台湾微软启动合作计画,将共建三大智慧云

远传近日宣布,与台湾微软达成战略合作计画,包含共建团队、共建平台及共建服务。为了建立DevOps团队,远传会导入微软Azure DevOps Services与Microsoft Teams,以提升远传AIoT应用与云服务的敏捷开发与管理效率。

另外,远传将打造数据中台和资料池,以梳理各核心系统间的资料,并透过API与Azure大数据平台、机器学习技术与Power BI介接,来提升远传决策的效率。最后,远传将参考母公司远东集团的产业经验,在Azure上,逐步建立智慧零售、智慧製造和智慧医疗,共三项云端服务,而台湾微软将提供云服务设计,及微服务、容器架构的技术等支援。(详全文)

  Google云端     安全公司Chronicle     单一安全平台   

Alphabet安全子公司Chronicle将整併入Google Cloud,强化企业用户安全性

Alphabet近日宣布,旗下安全产品子公司Chronicle,将併入Google云端事业体中,以强化企业端云服务的安全性。Chronicle原为Google X实验室里的一个专案,于去年初,独立为Alphabet的子公司,今年初,才正式推出第一款产品Blackstory,为安全遥测平台,可提供Google用户威胁侦测服务,另包含子产品恶意程式分析平台VirusTotal,提供网路威胁分析及防护。

待Chronicle併入Google云端后,Chronicle执行长Stephen Gillett指出, Backstory和VirusTotal将与Google云端原本的威胁侦测和资料防护产品,产生互补效果。VirusTotal将强化Google云端的威胁资料库,为用户提供威胁侦测服务,而Google云端检测和矫正功能将新增Backstory的调查流程,让用户更快速地检测和缓解威胁。两者合併后,可供用户涵括本地部署及云端环境的单一安全平台,整合事宜预计今年秋天完成。(详全文)

  AWS    EC2    实例更新   

AWS更新EC2的M5与R5系列实例

基于Nitro系统,AWS近期再度更新EC2的实例,为适用于通用负载的M5,以及专为资料探勘与记忆体分析设计的R5实例,增加了8xlarge以及16xlarge两种规格,而先前也已为C5系列加入新的虚拟化实例c5.12xlarge、c5.24xlarge,以及裸机实例c5.metal。M5系列是为网页伺服器、应用程式伺服器、开发,还有测试环境、游戏等通用目的工作负载设计,而R5系列的实例是专为记忆体密集的工作负载设计,此次EC2的M5和R5系列更新,也包含使用AMD处理器的低价实例,及储存选用NVMe SSD的实例。(详全文)

摄影/洪政伟

  更多Cloud动态  

1. 因应云端业者竞争,HPE所有产品自2022年起以服务方式提供(详全文)

2. 中华电信与宏达电要联手合作5G技术,以延伸发展云端应用(详全文)

3. ICNN宣布与.org管理机构PIR续约,并决定移除.org的价格上限,引起反弹声浪(详全文)

4. 微软更新Azure Monitor,现可透过检视图,一次监控整个虚拟机器扩展集(详全文)

5. AWS整合多项服务推出Control Tower,让用户快速设定并管理多帐户环境(详全文)

资料来源:iThome整理,2019年7月

免责声明:本文由用户上传,如有侵权请联系删除!