智慧消防:大数据在灭火领域的应用
台湾消防工作的推行日益艰困。城市化、人口聚集、经济产业的发展大幅增加救灾风险,民众对于安全的需求与渴望也节节攀升。
虽然随着科技发展,消防单位在救灾装备、战技与战术上已有长足进步,但在政府的人力编制与预算有限的情况下,面对日益增长庞大的勤业务压力,若实际走访第一线消防分队聊聊,你会看到出勤后刚返队的消防弟兄们,擦擦额头岑岑汗水,苦笑着说:「还勉强应付得过来...」
而这已经是最乐观的反应了。
能怎么办?
检讨勤务、调整政策、补足人力...,是现行消防工作,从中央到地方、从干部到基层,都盼望实现并持续努力的目标。即使如此,我们依然要关注几个问题:
一、政府预算越来越少,虽然充足的预算可购买更精良的装备机具车辆器材,但当数量超过既有人力的管理及使用能耐,在灾害应变时,解决问题的幅度依然有限,甚至反而成为负担。
二、政府编制只会减不会增,即使消防人力增加到法定员额,或许减缓消防人员过劳并增加消防人员休息及训练时间,但增加的人力远追不上日益成长的勤务量。
三、消防人员期盼的「回归专业」,从消防专业立场来看无庸置疑,但从整体民众需求、民意期待、政府执政的角度,必定无法接受增加预算、补足人力后,消防单位还是做跟之前一样的事。
其实,除了政策面,还可以从数据面着手,简而言之就是「大数据」。
别跟我谈信息,我只是消防队?
如果我们能够将各个小型数据集合并后,进行分析,便可得出许多额外的信息和数据关联性。
等等!大数据?我只是消防员呀!
消防人员常讲:「消防要回归专业」,没错,消防「勤务」跟「执行」要回归专业,但消防的「思维」不能只局限在消防领域。
如果所谓回归专业就是「吃的、想的、做的、拉的」都在消防的圈圈里,那才叫做「不专业」,因为就变成只困在消防的框框里,却没有意识到消防跟其它领域的相互关系、循环影响、运作方式甚至趋势变化,也因此所有的想法都在这个小框框近亲繁殖,你会发现大家的意见看法都很一致,但也很一致的对许多问题莫可奈何或根本看不到问题症结。丹尼尔康纳曼便在其著作「快思慢想」谈到:「我们不仅盲目于明显的事物,也盲目于自己的盲目。」
这个时代的两难困境在于,世界一方面密切整合、一方面分散零碎,全球日益牵一发动全身,而我们的行为与思维却困于小小谷仓里。
有时能解决、改善一个组织的问题,来自于外部的思维或模式。
没有要消防人员「亲自」去操作大数据运算,事实上也根本不可能,但我们要知道大数据可以「怎么样」?「哪些人」可以帮忙?我们自己能够「怎么提供」协助与支持?很重要的是,你要知道哪里有资源。
而如果我们能够克服谷仓效应,整合其它单位的大数据,绝对会有革命性的发现。
大数据+克服谷仓效应:纽约彭博市府的机密任务
「谷仓效应」书中谈到一个非常贴切的实际故事。
2011年4月25日凌晨,纽约布朗克斯一处贫民小区发生严重火警,造成多人丧生,媒体怒气冲冲地点名罪魁祸首,其中有些直指纽约市政府。
火警消息刚传出来,纽约市长麦可彭博问了属下一个问题:「能否采取什么方法来预防这类火警?」没有人答得出来。纽约市的一个黑暗秘密就是:住宅火警稀松平常,在2011年之前的那十年,每年约有2700间民宅失火,平均夺走85条性命。
纽约本身配有消防检查队,但只有200人,却要负起全市100万栋大楼与四百万户的消防检查,简直力不从心,市府也没有多余的经费扩编部门,另外,民众检举通报后的消防安检也经常白忙一场,因为只有13%的建筑违规通报是真的有问题。
福尔劳斯是纽约市政府团队中的一员,他奉命解决这个问题,而他并不是消防人员。
有时,比对乍看无关的信息会别有收获。
我们来看看他做了什么?
福尔劳斯在免费分类广告的网站张贴广告,征求年轻的「资料分析高手」,他想找刚从大学毕业,擅长经济数学,能提供崭新眼光的人,组成团队。并要团队整理纽约市的火警资料(消防局既有的各项报案数据、火警数据、311支专线违建通报...等),设法预测火警,结果一无所获。但发现一件事,多数违建通报的地点并非最常发生火灾的地区、也不是最多违建的地区。
消防局的数据显然不够,因此需要检视消防局以外的数据,福尔劳斯要求团队离开办公室,跟不同警察局、消防局、房屋署、建筑部的检查人员出去,以开放的态度亲临现场、看一看、听一听、修正假设。
后来一个线索逐渐浮现:容易失火的建筑通常建于1938年以前,因为纽约当时的建筑法规较宽松。
这些建筑通常位于比较贫穷的小区,持有人往往欠缴房贷,先前邻居通报过说有不良份子出入。依这样的线索动手开始检视相关数据,但面临一个困难:数据是储存于不同的数据库,整个市府团队不只不同部门各自为政,连同一部门内部都细分为不同团队,数据各自分散。
团队利用「一级地类税务数据库」挑出64万栋房屋,基于纽约特殊的法规,这些建筑有一半是由消防局负责检查,另一半是由建筑部。但团队一并检视这两个部门的不同资料,查看火警与违建申诉状况。另外,财政局与调查局是两个不同的部门,分别负责税务与诈骗问题,团队们则一并检视税款缴纳纪录与房贷拖欠纪录,然后再跟建筑局取得1938年以前的建筑资料,最后用「单一统计模型」比对所有数据,渐渐看出规律,也就是发现当一栋建筑物同时具备这四个危险因子,则失火与违建的比率高出很多,即使没人申诉亦同。换句话说,如果想找出容易失火的危险房屋,与其依赖311支专线的特定申诉,不如比对以下数据:房贷欠缴状况、建造年度、反映小区贫富的诸多指标...
在副市长的支持下,福尔劳斯找上建筑局的检查员,请他们根据研究计算的结果进行同类建筑的检查,建筑部只回他:「烂主意,别发神经了!」
当然最终态度软化,并采取他们的点子,结果相当惊人,原本若透过报案只有13%的受检房屋有问题,如今这个数字窜升为70%,尽管几乎没多花一毛钱,检查成效却暴增四倍!
是侥幸吗?团队开始把这一套运用到大型建筑,并继续开始跟着建筑局的检查员到处跑,有天,无意间,团队们跟检查员闲聊时,一位检查员说:「根据多年检查经验,肯花钱翻新磁砖的屋主不会容忍失火风险。」于是团队着手开始查看纽约市磁砖载运纪录,并把这份数据加入其它数据,结果预测准度大幅提升。
“纽约消防队如何用数据挖掘来灭火”探讨得更加详细:
在数据数据及统计更加完整后,纽约消防员将影响房屋起火的因素分为 60 个。除去危害性较小的小型独立屋,相关人员通过特定算法,为城市中 33 万栋需要检验的建筑物单独进行打分,这样当消防员每周出勤检验时,系统都会列出建筑物的详细数据和危险指数,决定哪些是优先「照顾」的对象。这个庞大的数据挖掘计划从2013年七月开始实施,预计会将全纽约建筑为归类成 2400 种,例如学校、图书馆这种比较重要的设施就会列入超常规检验对象。
稍做整理后,从执行步骤来看,福尔劳斯的做法分成五个阶段。
第一步:征求资料分析人员,组成团队。
第二步:整合其它单位数据,以开放态度亲临现场掌握线索。
第三步:进行数据整理与比对,看出规律。
第四步:争取市府奥援,实际验证成效。
第五步:扩大延伸应用。
纽约消防局发言人曾为此表示:透过数据,确实看到火灾数量的下降。
具体应用及遭遇问题
透过大数据若能聚焦、掌握出易发生火灾之区域后,在火灾预防工作上,最直接便可以做到以下几件事,节约人力、经费、资源:
一、聚焦重点消防检查、违规取缔对象,将有限的消防人力及资源用在刀口上,根据这些大数据显示的情报去确定检查对象和时间,而不是随机检查或者全部检查。
二、针对城市的易致灾区域,优化人力及车辆配置,甚至勤休制度的调整,降低人员于队部可能待命的空窗时间。
三、掌握城市各个角落对于消防安全知识的需求程度,从而有针对性的开展消防宣传工作,摒弃传统工作中的填鸭演讲式、拜托与讨好民众的教育方法。
那么在应用大数据上,可能会遭遇什么样的问题呢?
去年10月,纽约知名资料科学家威灵顿访台,他认为台湾政府的网站及资料公开的做法很友善,利于应用大数据处理数据。但台大经济系梁国源教授曾撰「恋上大数据之前必须知道的事」一文中提及:
大数据应用虽是各领域未来发展趋势,却非解决所有问题的万灵丹,对于操作大数据,需要具备几个重要的认知:
一、大数据技术只能做到相关性的了解,亦即仅知变量间的关系为何,无法得知因果条件。
二、若盲目地利用大数据所得的相关性结果去推论预定目标群中的人事物,是极有可能产生虚假相关。
三、大数据应用普及化后,极可能对隐私权造成侵害。
结论
纽约市政府福尔劳斯的做法虽可供我们参考,但台湾的消防深陷公务体系架构囹圄,加上公部门长期氛围为防弊而非兴利,使得消防机关动辄面对法律与调查,若资料的取得应用「可能」有所争议,便容易让好的、前瞻的、具魄力的计划胎死腹中或功亏一篑。
从小地方先着手,实验性的尝试、试办可能是目前最佳的策略,方向对了,就不嫌路远。
注:本文或蔡宗翰先生授权发布。