案例||DCS故障概述
DCS系统在工业生产过程中的广泛应用,使可靠性、稳定性问题更加突出,也使人们对整个系统要求越来越高,人们希望DCS系统尽量少出故障,又希望DCS系统一旦出现故障,能尽快诊断出故障部位,并尽快修复处理,使系统重新工作。为了便于分析、诊断DCS系统故障发生部位和产生原因,现把故障分为以下几类来进行论述。
1.现场仪表设备故障:
现场仪表设备包括与生产过程直接联系的各种变送器、各种开关、执行机构、负载及各种温度的一些元件等。现场仪表若发生故障,直接影响DCS系统的控制功能及操作人员对工艺参数的监视,从而给工艺操作带来一定困难。在目前的DCS控制系统设计中,这类故障占绝大部分,这类故障一般是由于仪表设备本身的质量和寿命所致。对这类故障比较直观,在判断和处理上也相对容易,在处理按常规仪表的处理方法一般不会有什么问题。对这类故障的处理要求维护人员对常规仪表的故障处理比较熟练,以保证故障处理的及时性及准确性。由于这类故障属于单点故障,对工艺影响不大,维护人员对DCS系统知识的要求不高,只须按常规仪表处理即可。
2.系统故障:
这是影响系统运行的全局性故障,系统故障可分为固定性故障和偶然性故障。如果系统发生故障后可重新启动使系统恢复正常则可认为是偶然性故障。相反若重新启动后不能恢复正常而需要更换硬件或软件系统才能恢复则认为是固定性故障。这种故障一般是由于系统设计不当或系统运行年限较长所致。
3.硬件故障:
这类故障主要指DCS系统中(I/O模块)损坏造成的故障。这类故障一般比较明显且影响也是局部的,它们主是由于使用不当或使用时间较长,模块内元件老化所致。
4.软件故障:
这类故障是软件本身所包含的错误所引起的。软件故障又分为系统软件故障和应用软件故障。系统软件是DCS系统所带来的,若设计考虑不周,在执行中一但条件满足就会引发故障,造成停机或死机等现象。此类故障并不常见,应用软件是用户自己编定的,在实际工程应用中,由于应用软件工作复杂,工作量大,因此应用软件错误几乎难以避免,这就要求在DCS系统调试及试运行中十分认真、仔细,及时发现并解决。
5.操作使用不当造成故障:
在实际运行操作中,有时会出现DCS系统某功能不能使用或某控制部分不能正常工作,但实际上DCS系统并没有故障,而是操作人员操作不熟练或操作错误所引起的。这对于初次使用DCS系统的操作工较为常见。
DCS系统一旦出现故障,正确分析和诊断故障发生的部位和原因是当务之急,故障的诊断是根据经验、根据发生故障的环境和现象来确定故障的部分和原因。根据平时在工作中对系统故障处理的经验和方法,对DCS系统故障诊断可按下述步骤来进行:
(1)是否为使用不当引起的故障。这类故障常见的有供电电源故障、端子接线故障、模块安装错误、现场操作错误等。
(2)是否为DCS系统操作错误引起的故障。这类故障常见的有某整定参数整定错误、某设定状态错误造成的。
(3)确认是现场仪表设备故障还是DCS系统故障。若是现场一次仪表故障,修复相应现场仪表或更换一次仪表。
(4)若是系统故障,应确认是硬件故障还是软件故障。
(5)若是硬件故障,则找出相应硬件部位,修复或更换硬件模块。(6)若是软件故障,还应确定是系统软件故障还是应用软件故障。
(7)若是系统软件有故障,可重启动看是否能恢复正常或重新装载系统软件,重新启动后若不能恢复则与系统管理人员或系统厂家联系解决。
(8)若应用软件故障,可检查用户编写的程序和组态的所有数据,找出故障原因。
(9)利用DCS系统的自诊断测试功能。DCS系统的各部分的设计有相应的自诊断功能,在系统发生故障时,一定要充分利用这一功能来分析和判断故障的部位和原因。
在实际应用中,对DCS系统故障要根据实际情况去分析和判断。在实际使用过程中,现场常见的系统硬件故障一般包括如下几方面:
(1)系统模块和元件故障,可能产生的原因是元器件质量不良、使用条件不当、调整不当、错误的接线引入不正常电压而形成的短路等。有时由于现场环境的因素,如温度、湿度、灰尘、振动、冲击、鼠害等原因也会造成系统硬件故障。
(2)线路故障:可能产生的原因是,电缆导线端子、插头损坏或松动造成接触不良,或因接线错误、调试中临时接线、折线或跨接线不当,或因外界腐蚀损坏等。
(3)电源故障:可以产生的原因是供电线路事故,线路负载不匹配可引起系统或局部的电源消失,或电压波动幅度超限,或某元件损坏,或误操作等产生电源故障。
软件故障包括:
(1)程序错误,设计、编程和操作都可能出现程序错误,特别是联锁、顺控软件,不少问题是由于工艺过程对控制的要求未被满足而引起的。
(2)组态错误:设计和输入组态数据时发生错误,这可以调出组态数据显示进行检查和修改。
由于DCS系统的都带有自诊断程序,系统能及时对挂在总线上或网络上的各回路及功能模块进行周期诊断。通过诊断,如发现异常现象,其内容就被编成代码或相应的故障提示,经由总线的操作站传递信息,从而在CRT上显示和报告故障发生的位置。通过CRT了解故障情况后,应进一步通过机柜里插卡或者模块上的一系列发光二极管的显示状态,查询不正常状态的故障内容。插卡或模块外部的故障则要逐步检查分析。
常用的故障判断方法有:
(1)直接判断法:根据故障现象,范围、特点以及故障发生的记录直接分析判断产生的原因和故障部位,查出故障。
(2)外部检查法:对一些明显的有外部特征的故障,通过外部检查,判断故障部位,如插头松动、断线、碰线、短路、元件发热烧坏、虚焊、脱焊等。有的故障,特别是暂时性故障,可以通过人为摇动,敲击来发现故障。
(3)替换对比法:对有怀疑的故障部件,用备件或同样的插卡或模块进行替换,或相互比较,但要注意,替换前,要先分析排除一些危害性故障,如电源异常、负载短路等引起元件损坏的故障,若不先排除,则替换上的插件或模块会继续损坏。
(4)分段查找法:当故障范围及原因不明时,可对故障相关的部件、线路进行分段,逐段分析检查、测试和替换。
(5)隔离法:可以分段查找法相配合,将某些部位或线路暂时断开,观察故障现象变化情况,逐步缩小怀疑对象,最终查出故障部位,进行处理或更换。对于组态错误,只要确认认为存在组态错误,只要核对组态表格及组态数据,对相应的组态数据进行修改即可,一般不存在困难。另外,充分利用系统厂家提供的故障检查流程图和故障诊断表也是快速诊断和判断处理故障的方法。通常在实际工作中,经常遇到的DCS系统故障,还有死机、黑屏及通信故障,这些故障通常导致工艺参数不能显示,严重时导致工艺系统停车,如死机故障产生的原因是多方面的,有的是因为操作不当所致,更多的原因是由于模块或插件故障所引起的,如显示器故障。主机故障,通信故障产生的原因多由通信线路、网卡及网络接线器故障所引起。
上述是针对DCS系统采用的故障判断和处理的一些方法,但是,现场故障是千变万化的,在实际处理过程中,要结合实际情况加以分析和处理,同时借助专家故障诊断系统及DCS供应商的技术支持,利用现代网络技术进行远程诊断和处理,已是一种快捷有效的故障判断和处理方法。虽然专家诊断系统还不完善,还在不断的发展中,但对我们进行DCS系统的故障判断和处理是有帮助的。在日常工作中,除了掌握相应的故障判断和处理方法外,更应该加强系统的日常维护,防范系统故障的发生,同时采取相应的管理措施来保证系统的安全可靠,如:加强DCS系统的环境和操作管理,加强防静电措施和良好的屏蔽,控制室要加强防雷措施并应该有安全可靠的接地系统等。