云计算十亿分之一故障是如何发生的?
“真的是见鬼了!竟然出现这种丢失用户数据的情况。”一位在云计算服务行业从业15年的工作者向《IT时报》记者抱怨。
近日,腾讯云丢失创业公司前沿数控数据的事件闹得沸沸扬扬,号称数据可靠性高达99.9999999%的腾讯云怎么会出现如此低级错误?假如哪天公有云上的数据又丢失了,中小企业面对阿里、腾讯、华为等寡头公司时又能获得多少赔偿?
近日,创业公司前沿数控发布公开申明称,因腾讯云操作故障导致其数据完全丢失,且无法恢复。这就好比银行的保险库被人撬了,曾被认为最有保障的云计算数据安全领域也出了问题。
腾讯云官网显示,其云服务器提供达99.95%的服务可用性和99.9999999%的数据可靠性,且搭载了云硬盘提供的三副本储存策略。按照官网信息,腾讯云数据丢失的概率仅为十亿分之一,这意味着即便发生地震、海啸等大型自然灾害,都难以撼动云端数据的安全性。前沿数控也表示,正是出于对腾讯云的信任,因此没有做数据的本地备份。
《IT时报》记者了解到,除了腾讯云在官方高调发布安全性数据,阿里云宣称其云盘采用了99.9999999%的可靠性设计,实例可用性达99.95%;百度云的产品特性文案中也表示,其云储存可靠性达到99.99999999%,可用性达到99.95%。
上海市云计算产业促进中心主任翁吉云告诉《IT时报》记者:“一般的云服务厂商做到99.95%的服务可用性和99.9999999%的数据可靠性并不是难事,对于BAT来说更是不在话下。其中服务可用性是指服务器系统宕机时长与正常工作的时长比,按照99.95%的比例算下来一年的宕机时间在200多分钟内均属于合理情况。而对于数据丢失,其实是非常罕见的情况,多是由人为故障造成的。”
一位业内人士告诉记者:“我们公司云服务器约有千台规模,虽然也会偶尔发生宕机的情况,但是数据从没有丢过,最坏的情况也就是通过第二备份找回。99.95%的服务可用性对我们这样小公司而言也不难做到。”
上海君澜蓝律师事务所律师陆怡佳告诉《IT时报》记者:“根据广告法规定,广告中使用的数据、统计资料、调查结果等引证内容,应该真实、准确并表明数据。如果用户对广告数据有所质疑,可以向工商局投诉、举报,再由工商局裁定。”
运维工作重要性高却不被重视
腾讯云本次出现丢失用户数据的情况,也是“一波三折”。
据悉,该故障源于磁盘静默错误导致的单副本数据错误。如果仅限于此,数据还可以恢复。但是腾讯云的运维人员在数据搬迁过程中又进行了两项违规操作,第一是正常数据搬迁流程默认开启数据校验,开启之后可以有效发现并规避源端数据异常,保障搬迁数据正确性,但是运维人员为了加速完成搬迁任务,违规关闭了数据校验。第二是正常数据搬迁完成之后,源仓库数据应保留24小时,用于搬迁异常情况下的数据恢复,但是运维人员为了尽快降低仓库使用率,违规对源仓库进行了数据回收。种种“巧合”叠加之后,导致了前沿数控的数据彻底丢失。
“云给企业提供了便捷和廉价,但是事事都有风险。云服务宕机情况或许会发生,但是数据丢失的情况真的非常非常罕见。这次如果不是运维人员操作失误,是可以恢复的。正常的应用或者平台上线,每过一段时间都要做灾备演练。数据丢失这种重大事故基本都和人为因素脱不开关系。”翁吉云告诉记者。
“腾讯云事件背后,应该反思的是对运维员工的培训和重视。运维属于一线员工,但岗位重要性很高,但在国内却不受重视。随着IT应用和硬件的增多,因运维产生的事故也在不断增加。另一方面,这件事也说明了用户企业对数据的不重视,对于这些以数据为核心的企业,异地备份和异云备份是非常有必要的。”翁吉云表示。
一位云服务器运维人员告诉记者:“运维职位一般工资都不高,也不受重视,而且年底考核的时候,业务部门汇报的是我们上线多少应用赚到了多少钱,运维人员的汇报却是我们今年宕机了多少时间,工作环境挺苦的。”
赔偿已“私了”
事件发生后,双方就赔偿问题引发争议。此前,前沿数控向腾讯云提出了1101.60万元的赔偿要求,而腾讯云提出的方案为“赔偿+补偿”,赔偿部分为“前沿数控”在腾讯云平台上产生的实际消费,共计3569元,此外还将为前沿数控技术提供13.29万元的现金或云资源补偿。两者之间相差近百倍。
陆怡佳表示,赔偿情况还是要根据双方的合同来判定。《腾讯云服务协议》条款显示,腾讯云公司的补偿责任总额不超过腾讯云公司就违约服务向客户收取的服务费用总额。
“一般来说,用户因云服务器宕机而造成的损失都是由用户自己承担的,因为云服务商已事先声明了服务可用性,只要宕机时间在服务可用性的范围内,都是合理的。但是对于腾讯云这种丢失用户数据的情况,业内比较罕见,并没有统一的赔偿方法,这个概率实在是太低了。可能要由双方私下去谈。”翁吉云告诉记者。
据悉,目前腾讯云与前沿数控已达成和解,但双方并未对外公布赔偿金额。“说到底这对双方而言都可以算是一桩家丑,不会对外大肆宣扬。但这件事对腾讯云的声誉还是会造成一定的影响。”一位云行业从业人士告诉《IT时报》记者。