机会,永远只会留给有准备的服务器
近日,Facebook及其旗下Instagram、WhatsApp、Messenger等App,在全球范围内遭遇大规模宕机。根据专供用户报告应用程序及站点问题的网站Downdetector数据显示,关于这场宕机事故的日内最高报错人数达到1.2万。
更为尴尬的是,因为部分服务器的故障时间长达10-24小时,用户完全无法登陆,Facebook最终不得不在推特上发布公告,通知用户宕机的实时调查结果。
这边扎克伯格焦头烂额,而另一边,趁着Facebook服务器配置变更导致宕机期间,其竞争对手Telegram的新用户注册量突然迎来激增。Telegram联合创始人帕维尔·杜罗夫(Pavel Durov)表示,“在过去24小时中,我看到Telegram迎来了300万新注册用户”。
Telegram“收化运发”的功夫不可谓玩得不漂亮,但实际上每次有高人气网站出现宕机情况时,同类型网站人气暴增也已经成为了惯例。而这对于后者来说,无疑是难得的吸粉好机会——但前提是这些网站的服务器也要做好准备。
过去微博也曾因为新版本用户协议引起大量用户不满,大量常驻画师提议转投另一家平台pawoo。结果没有任何准备的pawoo在几小时后服务器就宕机,而让人无语的是,根据pawoo的公告显示,造成服务器宕机的激增用户数量,不过是3小时内涌入2700名新用户而已。
所以说,机会,永远只是留给有准备的服务器。
所以有能力的公司,向来都极为重视服务器架构方面的技术升级,并且大多数互联网公司都有自己的服务器容灾系统,以防止平台宕机带来使用体验不便,或者对数据安全造成隐患。
就拿移动支付来说,如今不少年轻人交通出行刷乘车码,购物消费刷二维码,甚至储蓄、理财也统统集中在手机电子钱包上。你能想象有一天,支付宝或者微信钱包突然宕机超10多个小时吗?
不过大家可以放心,支付宝在相关技术上从来不含糊。去年在杭州举办的云栖大会ATEC主论坛现场,蚂蚁金服就展现了自家机房所采用的“三地五中心”的架构。简单来说,就是在3座城市部署5个机房,拥有这样一个架构,就算3座城市里有一两个机房发生故障导致断网,支付宝的底层技术系统也可以将故障城市的流量全部切换到运行正常的机房,还能保证数据一致且零丢失。
为了验证这一架构的安全性,支付宝还在当年那场活动中让工程师当众剪断了自家机房的光缆(当然,只是特别技术演练)。仅仅20秒的“系统异常”之后,整个系统就恢复了正常。
其实,这种在相隔较远的异地,建立两套或多套功能相同系统,互相之间进行健康状态监视和功能切换的服务器容灾系统,正逐渐成为很多互联网公司的“标配”。
除此之外,有些常用的社交平台还需面对特殊时间段流量暴涨给服务器带来的压力。比如大家日常使用的微博,在节假日往往会迎来流量的高峰,如果有明星毫无预警地在微博上宣布分手/交往/结婚/离婚,更是会让流量如搭火箭一般一飞冲天。那么在这里,节假日的流量高峰还可以预估,娱乐圈的突发事件则是让人猝不及防。
比如当初鹿晗关晓彤公布恋情时,正值微博搜索工程师丁振凯大婚之日,因为微博流量暴涨挤垮服务器,工程师只能在结婚现场紧急加班。而据微博CEO@来去之间 透露,当天更是紧急租用增加了1000台阿里云服务器来应对流量高峰,才保证了后续平台的良好运行。
指望明星在曝出猛料之前和微博工程师先打声招呼,显然并不现实。为了应对突发流量高峰,微博最终开发了一套通用的智能弹性调度系统,能实时监测业务的冗余度,并按需进行全自动化的扩缩容,无需人为干预。坊间曾有传言,现在微博的自动扩容系统,已经可以同时容纳8位明星并发出轨,所以也被称为“八轨系统”(误)。
自从微博用上这套自动扩容系统之后,不管是唐嫣罗晋宣布结婚、还是武侠小说泰斗金庸逝世,又或者是IG夺冠王思聪抽奖,都顺利扛住了流量高峰给服务器带来的压力。
尽管互联网公司为了服务器不宕机作出了这么多努力,但是还是难保天有不测风云。对于目前一些技术上还难以攻克的难关,程序员也只能用一项流传了千年的古老秘法——求神拜佛(包括但不限于烧香、贴符、开光、跳大神等),借助玄学的力量来解决宕机的问题了。
【本文图片来自网络】
推荐阅读:
不存在妥协的究极旗舰:三星Galaxy S10+评测
十代的技术积累,造就了又一款机皇三星Galaxy S10+。
多数杀毒APP可能只是样子货,骗财还要骗安全
手机杀毒软件真的有用?可能大家并不是太了解。