处理项目重大质量问题的思路和原则
在项目执行过程中,项目交付物发生重大质量问题应该不是个小概率事件。当然,通过项目技术质量管理、项目风险管理可以大幅度降低其发生的概率和影响,但往往不可能完全杜绝其发生。那么此类问题发生后,问题的关键就转变为项目组如何有效地应对处理。
本文不介绍具体的项目重大质量问题分析、处理的工具和流程,只从一般处理思路和原则角度对项目实践经验做个小结,企盼抛砖引玉。
一般思路和原则
故障调查和处理要依靠供应商
但不能依赖供应商
某市场多个项目发生A部件电气模块部分通道短路故障。故障模块和相应信息发回供应商处调查,供应商初期没有任何线索和思路。项目组现场服务工程师不得已,把故障电气模块独立拆解研究,初步定位故障原因,随后供应商确认此故障原因判断。
供应商具有研发设计、生产、测试项目设备或部件的知识、工艺、生产测试设备和相关经验,但其远离现场缺乏现场压力,有时过度依靠其内部流程、生产测试设备,解决问题的紧迫感不一定很强。作为项目的客户接口,作为项目结果的最终承担者,项目组要充分依靠供应商,但要做好自力更生解决问题的心里准备和准备相应的实际措施。
优先保运营保安全
注重快速临时方案的发布实施
某市场多个项目发生A部件电气模块部分通道短路故障,造成多个A部件模块和与其相连接的B设备烧损,并且此故障短期内频发且有愈演愈烈之势,严重影响业主正常生产运营;现场B设备备件入不敷出,采购价值高昂并且交期长。故障模块和相应故障信息都第一时间发回供应商处调查。
供应商初期没有任何有效地查找故障的线索和思路,短期内问题无法解决。在公司技术职能部门大力支持下,经过内部充分分析论证,项目组推出A部件电气模块两个通道串联的中间临时方案,立马缓解现场困境,没有新的故障发生。
在多个城市多个项目的C设备电机生产运营时烧损,生产监控系统显示严重故障,现场可闻到烧焦异味甚至有轻微烟雾,客户很紧张,给与项目组极大的压力。
项目组经初步检查判断是C设备电机轴承失效引起,在没有得到电机供应商根本原因调查结果和解决方案情况下,立即启动客户现场所有同类电机运行状态普查和电机轴承全面更换措施,组织一切资源先努力控制好故障发生范围和频率,优先保证客户安全生产运营,把故障影响降到最低。
这种场景下,解决故障的成本考虑放在第二位,首先要做的是行动措施快,控制现场,不让情况恶化。再扭转整体形式逐步朝好的方面发展,以资源换时间,等待供应商给出故障根本原因调查结果和彻底解决措施。
注重现场处理解决措施的有效性
有些故障根本原因有可能
永远无法完全调查清楚
某项目齿轮箱发生多起断销故障,同批次的齿轮箱在同类项目D完全正常,在另一个同类项目E也没有故障报告。齿轮箱供应商还是比较积极地配合进行故障原因调查。
第一次供应商给出的故障原因是齿轮箱外壳加工时有合盖台阶未去除,导致合箱时有铁屑掉落,现场把所谓有台阶的全部箱体整改后仍旧断销。第二次供应商给出故障原因是齿轮箱轴承轴向间隙超差,把原设计的空心销更换为实心销后仍旧断销。最后供应商又第三次提出更换为更大直径实心销方案,现场才没有断销故障继续发生。
该项目齿轮箱断销问题解决几年后,同类项目E也发生同样的故障,也应用同样的方案予以处理解决。
齿轮箱断销故障的根本原因是什么?是否真如供应商调查报告所提出的那样没有任何隐瞒?我们无法得知。但经过长达5年的运营验证,此故障现场不再发生,证明处理解决措施是有效的。在没有掌握直接的数据或证据前,某些故障根本原因可能永远是一个推测或猜测,永远无法圆满结案画上句号。
要注意防范解决措施产生的衍生问题
充分验证,保障安全
不同城市的多个项目报告设备F的CPU启动故障,并且设备G的状态控制显示屏在运行时经常发生黑屏重启现象。两个部件的供应商经过调查,言之凿凿地确信他们已找到故障的根本原因,并且故障可在其实验室重现,并提供相应升级软件包作为解决方案。项目组分别选取两个不同城市项目就此新发布的软件包小范围装车验证。经过一段时间观察,现场故障并未解决或完全解决,随后供应商也认可这一结果。
某市场多个项目的模块H由于某批次质量问题全部进行过整改,整改后原问题不再发生。但H部件模块在整改结束一段时间后又出现奇怪的新故障。经调查,该新故障是供应商解决批次质量问题时对电路板生产工艺修改之后造成的衍生故障。
对供应商提供的故障处理解决方案在现场实施时一定要慎重,尽量先小范围充分试验验证,确认不会对客户生产安全运营造成影响,然后再按步骤稳步推广。因为项目客户是项目组自己的客户,只有项目组自己对项目最终结果负责。无论故障处理方案结果如何,保障客户的现场生产运营安全永远是第一位的。另外,在解决旧问题过程中可能会衍生新问题,项目组对此要有清楚的认识和事先预防。
在客户满意度、处理代价、整改周期
三者之间平衡
在以前面的第一个案例A部件电气模块部分通道短路故障为例,尽管目前故障根本原因调查清楚,现场也实施了临时方案,遏制和控制了现场故障频发的状况。但要彻底解决这一问题,需把该市场所有相关项目涉及的所有A部件模块更换为新版本升级硬件,现有的模块全部报废。
硬件更换费用很高,供应商生产也需要一定周期,更重要的是,新版本升级模块刚刚只在国内个别项目上使用,工作效果如何,有没有其它衍生问题不得而知。现场马上实施更换新版本硬件的A部件模块存在风险。鉴于此,项目组考虑对先前提出的中间临时方案变更为最终长期方案的可能性,并且如何说服客户接受。
多个项目的J模块在设备运行中发生爆裂,供应商调查后认为模块的大功率元件受运行环境影响较大,某些条件综合作用下才会发生爆裂故障,提出新版本的大功率元件可以彻底解决这一问题。
在中国项目市场该J模块存量规模很大,全部更换时间周期无法预计,客户也很难接受这种周期;大功率元件又是该J 模块中最重要最昂贵的部分,供应商很强势,不可能同意无偿提供。在这种情况下针对涉及的现有J模块,现场提供更多备件周转,为客户额外延长一定时间免费质保的解决方案放在了桌面上。
某些情况下解决项目质量问题时尽管已有彻底技术解决方案,但在实际工作中是否采纳实施却要根据项目实际状况综合考虑。很多时候要在客户满意度、处理代价、整改周期三者之间寻求一种平衡,以维护公司的最大利益。
技术上可能无法彻底解决的故障和质量问题
要准备B计划-商务解决方案
设备K的状态显示屏黑屏重启故障在很多项目上发生,供应商也调查几年了,但一直没找到真正故障根本原因。供应商能不能最终找到,还要花多少时间,一切都是未知数。这个故障尽管对生产运营有一些影响但有限,客户也并没有把它摆在很重要的位置上,但会在项目关闭时作为一个项目开口项提出。
针对这种会影响项目关闭,技术上可能无法彻底解决问题的故障,可以考虑从商务角度补偿客户,通过利益交换让客户同意关闭此开口项。
多项目协同
有效利用资源
设备L某部件改造涉及到很多项目,而且对备件、改造材料、改造人力资源都有共同需求。如果由各项目单独和不同支持职能部门或供应商沟通,势必会有资源冲突,造成内部互相倾轧,增加总体解决成本和周期,也会破坏内部正常工作关系。
这种条件下,由高层管理者建立特别工作专责小组统一协调、统一规划安排,有效利用资源,各项目协同作战,不仅对组织整体有利,也减轻了各项目组的工作压力,帮助各项目组顺利完成此专项整改工作。
应具备缜密的逻辑思维能力
上面讨论了很多处理项目重大质量问题的实际案例,提出了一些工作思路,下面特别强调几点,供大家在处理项目重大质量问题过程中参考:
1. 当前项目着急要解决什么问题?客户的关切点是什么?
2. 目前有哪些资源可以利用?
3. 如何审慎验证供应商提供的调查结论和处理措施?
4. 如果供应商靠不上,有没有其他可选项?
5. 具体工作步骤要有计划有条理,先大后小,先急再缓再彻底
6. 思考问题、解决问题如何兼顾广度和深度?
7. 最终的解决方案是什么,项目组可以承受吗?
8. 是不是综合考虑过商务因素、客户满意度及对后续项目的影响?对项目关闭有何影响?
近期热文
作者:涂斌,西门子公司工作逾20年的资深项目总监,一个“专一只为做到最专业”的项目管理专业人士。