这就是近日发生在韩国的“互联网大瘫痪”事件。
国民App中断10小时
起因只是一个锂电池
10月15日下午3:33分,位于首尔的SK C&C数据中心大楼发生火灾,该大楼管理着社交软件Kakao、门户网站Naver等核心平台运营商的数据。大火导致Kakao出现登录问题和消息传递失败,而Naver的一些服务也出现故障,包括搜索、新闻和购物等。
Kakao在韩国拥有4300-4700万的活跃用户(韩国全国人口约为5100万),涵盖即时通讯、移动支付、在线交易、在线地图和打车等功能,堪称是韩国的“国民社交软件”。
而Naver也被称为“韩国版百度”,同样拥有大量用户。因此当两家公司的数据中心同时发生火灾后,直接导致了韩国互联网服务大面积瘫痪。
然而事件的原因,仅仅是因为锂电池导致。
据韩国警方消息,起火地点为数据中心A栋地下3层电气室的锂电池架附近。电源堆放在五个电池架上,事发时,其中一个锂电池产生了火花并引发火灾。
而在经过10个小时的中断后,Kakao的部分功能终于开始恢复。
显而易见的是,这起事件对依赖Kakao服务的数千万用户(包括公司和小企业)产生了广泛的影响,其中许多人正在考虑对这家科技公司提起集体诉讼,要求赔偿在停电期间遭受的损失。Kakao自身也遭受了巨大损失,Kakao的股价周一(17日)蒸发2万亿韩元(约101亿元人民币)市值,其联席CEO南宫勋(音)宣布引咎辞职。
此外,韩国政府突击搜查了SK C&C的总部,以寻找数据中心火灾背后的真正原因,这促使政府加大对数据中心的审查力度,并对该国的数据中心制定更多法规。
两年3起数据中心大火
大量数据中心存在火灾隐患?
“Kakao一停,大韩民国就停止了”。
从工作到生活,对于今天高度依赖互联网的我们来说,这起事件一度引发了人们的思考,比如是否应该重度依赖个别App?不过今天我们不谈这个,还是说说和企业级相关的,因为有许多IT人士开始担心,是否数据中心大量存在火灾隐患?
这起事件,已经是近两年内的第3起数据中心大火。
●今年8月,一个位于英国的谷歌数据中心,就因电气爆炸而起火,三名在数据中心附近的变电站工作的员工受伤。
●2021年,一场大火完全摧毁了OVH在法国的一个数据中心,并部分损坏了另一个数据中心,所幸无人受伤。
而从数据上看,发生数据中心火灾的事故是十分罕见的。
据Uptime Institute称,自1994年以来,该机构成员共享的8000起异常事件中,其中仅记录了11起数据中心火灾,即每年不到0.5起。从2016年到2020年,该机构的数据库仅有13条公开报告的火灾造成的停电记录。
虽然仅仅从这两年发生的数据中心火灾事件来看,我们还不能断言相关事件正在呈上升趋势,但此类事件依然也给我们敲响了警钟,因为一旦发生,其后果通常是毁灭性的。
为了降低数据中心发生火灾的风险,Uptime Institute提供了以下三条建议:
1.检测:使用 VESDA(非常早期的烟雾探测设备)系统。在火灾隐患产生的初期尽早地发现火情,从而避免火灾损失的发生或把损失减低到最小限度
2.灭火:确保适当的防火屏障和系统隔离到位,并始终保持灭火系统得到良好的维护。
3.缓解:进行定期风险评估,以识别和解决这些系统的任何问题。
除了采取所有必要的检测、灭火和缓解措施外,数据中心的运行还必须制定稳健的灾难恢复计划,包括备份、复制和恢复程序,以及确保快速响应和快速恢复的流程的服务和运营。
灾难恢复
怎么强调都不为过
说起灾难恢复,一定会有人觉得老生常谈。但一次次惨痛的教训告诉我们,灾难恢复,怎么强调都不为过。
韩国的这起火灾事件中,就让我们看到了一个鲜明的对比。
因SK C&C数据中心大楼火灾,而受影响的两家公司——Naver和Kakao。前者虽然也发生了业务停顿,但由于公司有异地备份,它们在几个小时内就恢复了。而另一方面,Kakao没有灾难恢复计划或备份站点,导致了长达数天的中断。
尽管Kakao表示,一旦数据中心全面投入运营,它将在两个月内建立冗余,以防止类似的中断。但这一切,都是在巨大损失之后...
在企业和个人高度依赖互联网的今天,值得肯定的是,许多企业用户已经认识到了数据安全的重要性,也在采取各种措施来确保业务连续性,比如通过云上数据保护。
然而需要明确的是,在公有云中备份了数据,是不是就可以高枕无忧?显然不是!如果只有唯一一份数据备份副本,万一这份数据遭受破坏,企业用户恢复数据就无法实现。在容灾环境下,云上和云下的网络连通,如果云上环境让黑客突破了,云下的设施一样暴露在网络攻击之下。
因此,终极的数据保护手段应该是:
1、 云下数据中心建立CR保险库,设置逻辑弹性网闸与生产网络隔离;
2、 每天把已下云的关键备份数据复制到CR保险库;
3、 对保险库的数据上锁,生成不可篡改版本,并在隔离区对数据进行扫描和侦测,分析数据是否受感染;
4、 对数据副本进行完整性验证。
基于上面的上述数据安全保护思路,戴尔科技集团在业界首次提出的“三位一体”数据保护方案,实现“BR”+”DR”+”CR”的全面数据保护体系,为企业用户提供安全可靠的网络弹性解决方案。
BR:Backup and Recovery,所有数据需要做备份
DR:Disaster Recovery(备份数据下云),重要数据需要复制下云
CR:Cyber Recovery,关键数据需要做网络弹性保护
建设“三位一体”数据保护方案,离不开戴尔科技集团在数据保护领域的强大技术实力,无论云上还是云下,无论多云还是混合云,戴尔都有相应的产品可以提供,从而为企业用户实现完整、安全和可靠的数据保护体系。
例如在多云数据保护方面,戴尔已经与AWS、Azure、谷歌云等多个公有云厂商建立了合作,既能将本地的数据归档和备份到云,也能在公有云上提供云内备份,构建云端的备份容灾方案。当需要满足合规要求时,也可以将备份放到本地环境。
在国内,戴尔也与阿里云进行了合作,其云分层技术(Cloud Tier)已经正式支持阿里云,用户可以将数据无缝、高效地从PowerProtect DD和集成式数据保护应用装置(IDPA)系统,通过云分层的方式迁移至阿里云平台,从而帮助用户以更高性价比,实现更有效的数据备份和管理效率。