从“事故”到“故事”,只有47分钟

大家好,我是倡导“人人如龙”的镭师兄,每天一个观点和话题,今天我们聊一下“工作中的紧急事故”。

产品在使用时遇到紧急故障,客户已经指着鼻子了,这个时候怎么办?

唯一减缓客户情绪和焦虑的方法就是全力以赴、及时补救,将损失减小到最轻。

----

12年前,我还在公司的研发部门,我们的产品远销海外,主要服务于当地的电信供应商。

这就意味着我们与海外的客户经常有时差,对方在上班的时候,我们这边可能正处于深夜。

凌晨,电话突然响起来

大概在5月的一个深夜,我的手机突然响了起来,我一看是领导老H的电话。

他说:“你现在就去公司,非洲某国的客户遇到一个紧急故障,必须立刻解决掉,你以前写过几个类似的案例,应该能帮得上忙。你打这个电话,了解情况。”他给了我一个号码。

我一听就着急了,看一下闹钟,现在还是凌晨1:12分,估计一线的同事现在急疯了,否则不会在这个时间点直接找到研发来求助的。

----

我一边快速穿衣服,一边拨打那个海外同事的号码,了解情况。

同事说他们那边当地时间是晚上6点多钟,正是业务高峰期,客户的网络突然某些片区的断网,有两个区域还是商业区。

当地办事处的同事现在已经到了客户的机房现场,但是故障无法快速定位出来,客户的领导就站在他们背后,只能找研发求助。

我一边通话,一边出门向公司跑过去。我住的地方离公司很近,平时只有10分钟的步行路程,而且当时没有打车软件,很难及时叫到出租车。

3分钟之后,我气喘吁吁地跑到公司楼下,这个时候还一直与办事处的同事保持通话中。

楼下的保安看了一下我的工卡,就放行了。

----

进电梯前挂了电话,我乘坐电梯快速到了自己的工位,电脑接入系统后发现必须到机房的模拟环境中去核对服务器的相关信息,于是就下到8楼的机房,结果我的工卡刷不开门禁:因为我不是机房管理员。

连续徒劳地刷了几次工卡,都无法打开门,这个时候办事处的同事电话又打过来了,我告诉他我在机房门口,一会进去,让他等一下,然后挂了电话。

机房门口贴了管理员的联系方式,我打过去,大概20秒之后接通了,管理员说他出差了。

紧急时刻,总是会有意外

我一听就要原地爆炸了,但还是压制着急躁的情绪,问他将门禁卡交接给谁了。

他说:“别急,交接人住得比较远,但在我工位后面的密码柜中还有一张备用的门禁卡,密码柜的密码为xxxx。”

他的工位在5楼,我等不及电梯了,就从楼梯上快速下到五楼,结果弄巧成拙:

该死的!这一层楼梯间进入工作间的门不知道为什么是锁上的,只能从工作间那个方向打开。气得我狠狠踢了一脚铁门。

----

快速衡量了一下,我不清楚其他楼层是否也是这样,保险起见,我还是爬上8楼,从电梯上下到5楼,这个过程浪费了5分钟。因为快速爬楼,更因为着急,自己心跳如鼓,汗流浃背。

在管理员的密码柜中拿到门禁卡后,再回到8楼,快速进入机房,听着空调嗡嗡的熟悉声音,急躁的心情一下子放缓下来。

在我开始核对信息时,另外两个同事也赶到了,他们直接到了机房,我们三个人分工,一个核对信息,一个分析日志和代码,我在内部库中找类似案例。

这时候海外办事处的同事将我们这边情况告知了客户,稍微安抚了一下客户的情绪,哄着客户去机房外面抽烟去了。

我们几个紧急定位之后发现这个问题很难短时间内找到根因,应该是与设计的套餐参数有关系,不过我们给出了规避方案,就是将虚拟内存的空间扩大3倍,就可以恢复业务,但是具体原因要继续定位。

办事处的同事立即按照我们给的操作进行规避处理,很快业务就恢复了,客户对我们的快速反应能力非常赞赏,观察了一会也离开了。

后来这个案例就成为客户讲给别人听的故事,充分肯定了我们公司的能力。

----

快速解决问题,及时恢复信任

我这个时候看了一下手表:1点59分。这次紧急事故从接到电话到恢复业务,一共花费了47分钟的时间。

虽然这个过程很短,但是大家都是冲刺速度过来的,所以决定先回去休息,上班的时候再分析问题。

后来我们出了一个补丁版本,彻底解决了这个问题。

----

在工作中,一定会遇到各种紧急情况,尤其是关系到客户利益的事故问题。我在一些客户的现场见过很多类似的场景,大多数公司第一反应就是定位问题,也有的公司则是推脱责任。

实际上,只要能够快速解决问题,这样的公司更令人放心,说明公司的快速处理能力是更靠谱。

大概就是所谓的“患难见真章”吧。

(“人人如龙”,我是聚焦个人优势的镭师兄,请关注我。)

(0)

相关推荐