DCS控制系统中常见故障及处理(五部分)


第一部分

1
分散控制系统(dcs)概述

DCS具有通用性强、系统组态灵活、控制功能完善、数据处理方便、显示操作集中、人机界面友好、安装简单规范化、调试方便、运行安全可靠的特点,在国内外电力、石油、化工、冶金、轻工等生产领域特别是大型发电机组有着较为广泛的应用。目前国内应用较多的的品牌主要有:

  (1)国外品牌:霍尼韦尔、ABB、西屋、西门子、横河等;

  (2)国内:国电智深、和利时、新华、浙大中控等。

  DCS的安全、可靠与否对于保证机组的安全、稳定运行至关重要,若发生问题将有可能造成机组设备的严重损坏甚至人身安全事故。所以非常有必要分析DCS运行中出现的各类问题,采取措施提高火电厂DCS的安全可靠性。

2
DCS在生产过程中的故障情况

每个厂家的DCS都有其各自特点,因此其故障的现象分析和处理不尽相同,但归纳起来由DCS引起机组二类及以上障碍可划分为三大类:

  (1)系统本身问题,包括设计安装缺陷、软硬件故障等。

  (2)人为因素造成的故障,包括人员造成的误操作,管理制度不完善及执行环节落实。

  (3)系统外部环境问题造成DCS故障。如环境温度过高、湿度过高或过低、粉尘、振动以及小动物等因素造成异常。

2.1
DCS本身问题故障实例

此类故障在生产过程中较为常见,主要包括系统设计安装缺陷、控制器(DPU或CPU)死机、脱网等故障,操作员站黑屏,网络通讯堵塞,软件存在缺陷,系统配置较低,与其他系统及设备接口存在问题等。

2.1.1 电源及接地问题

(1)  某电厂DCS电源系统采用的是ABB公司Symphony III型电源,但基建时仍按照II型电源的接地方式进行机柜安装,与III型电源接地技术要求差异很大。机组投产以来发生多次DCS模件故障、信号跳变、硬件烧坏的情况,疑与接地系统有关。同样,某电厂在基建期间DCS接地网设计制作安装存在问题,DCS系统运行后所有热电阻热电偶温度测点出现周期波动。

(2)   某厂因电源连线松动而导致汽机侧控制系统失效。

经验教训:DCS没有良好的接地系统和合理的电缆屏蔽,不仅系统干扰大,控制系统易误发信号,还易使模件损坏。可见,ups电源、控制系统接地等存在问题将给电厂投产后DCS的安全稳定运行留下极大隐患。因此,DCS系统电源设计一定要有可靠的后备手段,负荷配置要合理并有一定余量;DCS的系统接地必须严格遵守制造厂技术要求(如制造厂无特殊说明应按照DLT774规定执行),所有进入DSC系统控制信号的电缆必须采用质量合格的屏蔽电缆,并要同动力电缆分开敷设且有良好的单端接地。

2.1.2 系统配置问题

(1)  浙江某电厂DCS(T-ME/XP系统)频繁故障和死机造成机组停运事故。7、8机组(2*330MW),从1997年2月试生产至5月,两台机组共发生22次DCS系统故障和死机,造成机组不正常跳闸8次。之后又多次发生操作画面故障(8号机组有两次发生全部6台操作站“黑屏”),严重威胁机组安全。经分析认为其DCS系统存在以下几个方面的问题:

① DCS工程设计在性能计算软件、开关量冗余配置上存在问题。

② 硬件配置不匹配(其中包括T-ME和T-XP两种系统的匹配和通信问题)。

③ 个别硬件设计不完善。

④ 进一步分析,关键的CS275(下层T-ME)通讯总线负荷率过高出现“瓶颈”问题现象。而欧洲T-ME/XP系统用户在配置合理的前提下,T-ME/XP系统使用情况基本良好。

(2)  某电厂在200MW机组的热控系统自动化改造上使用的DCS,由于系统配置的负荷率计算不准且为了减少投资,技术指标均接近允许极限,加之该系统有运行时中间虚拟I/O点量大的特点,所以在改造后期调试时发现个别控制器的负荷率竟超过了90%,个别软手操操作响应竟接近1min,根本无法使用,后经过大幅度调整(系统重新增加配置),才解决了这个问题。

(3) 东北某600MW机组,由于招标技术规范对I/O通道隔离性质表述不到位,因此DCS厂家做的配置很低,结果在调试时烧损了大量的I/O板,后来改变了隔离方式和更改换了硬件,电厂又花费了许多资金,也抵消了当初的招标价格优势。此外,电缆的质量与屏蔽问题也必须高度重视,重要信号及控制应使用计算机专用屏蔽电缆,许多改造工程正是由于电缆的问题导致电缆不得不重新敷设,影响了工期。

(4)  某电厂300MW机组新华XDPS-400系统工程师站频繁死机,经检查发现其运行程序较多:多个虚拟DPU、历史数据记录、性能计算、报表等。把历史数据分配至别的人机接口站问题解决。

2.1.3 控制器(DPU或CPU)故障

(1)  某电厂300MW #2机组HIACS-5000CM控制系统FSSS1的CPU故障,且未将控制权交出,从CPU未能切换为主控,导致该部分系统控制设备无法操作(设备保持原状态工作)。在对主CPU执行在线更换步序至停电时,从CUP切换主控CPU,系统设备受控,更换原主控CPU后系统一切正常。

(2)  ABB早期某时间生产的SYMPHONY 同一PCU机柜内不同控制器之间通讯出现数据不一致的情况,通过升级固件这一问题得到解决;

(3)  新华控制XDPS系统早期某批次DPU曾多次出现离线、死机现象,经检查为DPU卡件个别电容问题,经升级更换卡件问题解决。

  由于目前DCS的控制器均为冗余配置,大大减少了主控制器“异常”引发机组跳闸的次数。但是,一旦一对冗余的控制器同时死机,将直接威胁到安全生产,对于此类情况一定要采取措施切实避免。

2.1.4 DCS网络故障

(1)  某电厂西屋WDPF控制系统,由于多次改造系统增加了大量测点和自动控制回路,系统负荷率高达70%以上,造成网络通讯堵塞,多次出现操作员进行操作、切换画面时间过长、画面黑屏等问题。后经升级改造为OVATION系统,系统正常。

(2)  某电厂600MW机组负荷508MW,工况稳定,汽轮机所有调门突然大幅摆动,经检查故障原因是机组运行时M5 控制器的转速信号短时间内由3000r/min 变成了0r/min,又马上恢复,调门摆动的原因也是M3和M5通讯时出现掉数据现象,导致Trip Bias(跳闸偏置)信号在机组运行时由0变为1,引起所有调门大幅摆动。对该问题采取措施:对PCU 控制总线的通讯信号进行多重化处理,对通讯信号增加一定延时,躲过通讯信号瞬间跳变;对重要的通讯信号采用了通讯冗余。

2.1.5 DCS软件问题

(1)  某电厂300MW供热机组DCS调试过程中未对测点品质参数进行修改,致使其模拟量测点只有在断线的情况下才认为是坏品质测点,未充分起到品质校验功能。后对所有测点品质参数进行了设置,提高了设备运行的可靠性。

(2)   HIACS-5000CM控制系统画面组态时,双击grab组态工具后,弹出c++错误窗口无法正常使用。经检查发现grab.ini 文件被改动过,从其他机器拷贝文件覆盖后,工具恢复正常。因为grab 非正常退出后保留了错误的信息在grab.ini 文件中。

(3)    某电厂除氧器水位控制回路逻辑是由高加水位控制逻辑拷贝修改而成,修改过程不彻底,PID参数未根据除氧器情况设置整定,造成运行中除氧器上水门发散调节,调节品质恶化。采取措施:检查逻辑,重新整定PID参数。

2.1.6 系统接口问题

某电厂200MW供热机组电气并网信号至DEH只有一路,在机组正常运行的过程中该电气并网辅助接点故障出现抖动,造成汽轮机跳闸。采取措施:使用屏蔽通讯电缆,增加冗余接点信号,并进行3取2逻辑判断。

2.2
人为因素造成DCS故障实例

人为因素造成DCS的故障,在生产过程中也较为常见。包括人员造成的误操作,管理制度不完善及未按规程规定执行工作步骤等。

2.2.1 未按规程规定执行工作步骤

(1)  某电厂新华XDPS系统DEH的#12DPU故障,对其在线更换,使用的是小机MEH系统的DPU备品。在更换DPU后,只将#32主控DPU拷贝至#12副控未写电子磁盘,其实质只是将副控DPU的内存内容与主控保持一致,#12DPU电子磁盘内容仍为MEH小机控制逻辑。在系统停电吹灰后,按顺序启动#12DPU成为主控,由于其逻辑为MEH逻辑而非DEH逻辑,造成系统通讯异常、数据频闪、画面显示不正常,人机接口站无法操作。在重新对#12DPU送电,拷贝#32DPU逻辑并写盘后正常。

(2)  某电厂HIACS-5000CM控制系统,循环水泵房远程I/O卡件更换,未执行在线更换操作步骤,其卡件未能激活进入工作状态,导致现场设备状态与DCS画面不符,设备无法控制。执行在线更换步序后,系统正常。

2.2.2 人员误操作

(1) 某电厂机组运行中,在进行处理缺陷时工作人员误动DCS继电器柜继电器造成引风机跳闸,锅炉MFT。

(2) 某电厂DCS卡件故障,在进行更换卡件过程中,由于工作人员未认真核对设备、卡件,跳线错误导致新更换的卡件烧损。

2.2.3 管理制度不完善

(1) 某电厂DCS系统管理制度不完善,未对软件升级、备份等工作进行规定。其辅网水处理POK1操作员站在升级打补丁后,未进行备份。该操作员站硬盘出现故障在进行系统恢复后,由于其软件版本较低,导致与网络通讯不正常,数据不刷新。

(2)  某电厂操作员站管理不严,其放置于集控室的主机USB端口及光驱未进行有效封闭,个别运行人员夜班期间利用操作员站玩游戏、看电影,导致操作员站死机。

2.3
外部环境因素造成DCS故障实例

外部环境因素造成DCS故障的数量相比于前两类问题而言相对较少,但在实际生产过程中也时有发生。

(1)    某电厂电子设备间风道口正处于DPU机柜上方,由于设计和其他原因,机组运行中消防水通过风道流入DCS机柜,导致DPU、服务器等设备进水烧损,机组停运。

(2)    某电厂循环水泵房远程IO柜,由于底部封堵不严,造成冬季老鼠窜入,在机柜上部温度较高处构筑巢穴,最终造成远程IO脱双网。

(3)    某电厂电子设备间的封闭性较差,卡件、DPU积灰较为严重,曾多次出现故障。在采取完善电子间封闭、加装空调等措施后卡件、DPU等故障基本杜绝。

通过以上诸多故障实例,我们不难看出,降低DCS系统的故障几率,必须做好分散控制系统从选型设计到运行、维护的全方位工作。

3
DCS故障防范及维护措施
3.1
DCS的选型设计调试
3.1.1

无论新建机组还是升级改造的DCS,系统和控制器的配置要重点考虑可靠性和负荷率(包括冗余度)指标。通讯总线负荷率设计必须控制在合理的范围内,控制器的负荷率要尽可能均衡,要避免因涉及规模大而资金不足所带来的、影响系统安全运行的“高负荷”问题的发生。

3.1.2

系统控制逻辑的分配,不宜过分集中在某个控制器上,主要控制器应采用冗余配置。

3.1.3

电源设计必须合理可靠。一是要强调电源设计的负荷率;二是要强调电源的冗余配置方式,同时一定要保证两路电源的独立性。

3.1.4

要注重DCS系统接口的可靠性措施。强调重要接口的冗余度和接口方式的选择,主要是注意可靠性和实时性。

3.1.5

对于DCS系统接地一定按厂家要求执行,避免接地问题造成系统大面积故障。应注重考虑系统的抗干扰措施、自诊断和自恢复能力,I/O通道应强调隔离措施。电缆的质量与屏蔽问题也必须高度重视,重要信号及控制应使用计算机专用屏蔽电缆。

3.1.6

要充分考虑主辅设备的可控性,要根据设备的运行特点和各种工况下机组处理紧急故障的要求,配置操作员站和后备手操装置。紧急停机停炉按钮配置,应采用与DCS分开的单独操作回路。同时,不能盲目地追求人机界面的“简洁化”,系统配置还应以满足安全生产为第一位。特殊有关安全的紧急干预性操作不能完全建立在DCS完好的基础上。

3.1.7

对涉及机组安全的执行机构、阀门等外围设备,在设计与配置时,要保证这些关键设备在失电、失气、失信号或DCS系统失灵的情况下,能够向安全方向动作或保持原位。

3.1.8

对于保护系统,应采用多重化信号摄取法,并合理使用闭锁条件,使信号回路具有逻辑判断能力。

3.1.9

在调试期间按照调试大纲和具体办法,对所有逻辑、回路、工况进行测试。

3.2
DCS运行、启停维护
3.2.1 做好维护准备工作

做好DCS系统的维护工作,主要包括:

(1)  维护人员应了解系统总体设计思路。熟悉DCS系统结构和功能构成,了解系统设备硬件知识,熟知各部件如控制器、IO卡件、电源等正常状态和异常状态,熟练掌握DCS组态软件。

(2)   系统的备份:包括操作系统、驱动程序、引导启动盘、控制系统软件、授权盘、控制组态数据库,并控制组态数据是最新的和完整的。针对实际使用中的光盘容易磨损的缺点,注意多做备份,并采用移动硬盘、U盘、硬盘等备份形式确保各软件的保存。

(3)    硬件储备:对易损、使用周期短的部件和关键部件如键盘鼠标、I/O模块、电源、通讯卡等都应根据实际情况作适量的备份,保证各类型卡件、模块备品不少于1个,并按照制造厂要求存放,如有条件应对备品进行校验,切实掌握备品卡件模块状态。

(4)    整理各类产品的售后服务范围、时间表,形成一份硬件生产厂家、系统设计单位技术支持人员通信录,充分利用DCS供货商和系统设计单位技术支持。

3.2.2 日常维护

系统的日常维护是DCS系统稳定高效运行的基础,主要的维护工作有以下几点:

(1) 根据25项反措要求、DL/T774检修维护规程等制度文件规定,完善DCS系统管理制度。

(2)  保证电子设备间的良好封闭,防止小动物窜入,减小粉尘对元件运行及散热产生的不良影响,保证温度、湿度符合制造厂规定,避免由于温度、湿度急剧变化导致在系统设备上的凝露。可考虑将DCS电子间的环境温度信号引入CRT中,并有报警。

(3)  每天检查系统各机柜风扇是否工作正常,风道有无阻塞,以确保系统各设备能长期可靠地运行。

(4)  保证系统供电电源质量且为两路电源可靠供电,当任一电源失去即报警。

(5)  电子设备间禁止使用无线通讯工具,避免电磁场对系统的干扰,避免移动运行中的操作站、显示器等,避免拉动或碰伤设备连接电缆和通讯电缆等。

(6)  规范DCS系统软件和应用软件管理,软件的修改、更新、升级必须履行审批授权及负责人制度。严禁使用非正版软件和安装与系统无关软件,做好主机USB端口、光驱等的封闭管理工作。

(7)   做好各控制回路的PID参数、调节器正反作用等系统数据记录工作。

(8)  检查控制主机、显示器、鼠标、键盘等硬件是否完好,实时监控工作是否正常。查看故障诊断画面,是否有故障提示。

(9) DCS设备包括DPU、人机接口站等上电应按照一定次序逐一进行,每台设备上电观察正常后再进行下一设备上电,避免出现异常难于分析。上电后,通信接头不能与机柜等导电体相碰,互为冗余的通信线、通信接头不能碰在一起,以免烧坏通信网卡。

(10)  定期对DCS主系统及与主系统连接的所有相关系统的通信负荷率进行在线测试。检查冗余主从设备状态,条件许可或定期进行主从设备切换,对设备自行切换的原因进行检查分析。

(11)  增加组态易读性:对重要组态页增加了中文描述;对重要保护系统编写与组态一致的详细逻辑说明书;编制试验操作卡并保证随时更新。规范DCS组态作业,机组运行中尽量不做重大组态修改。必须进行组态时应慎重,充分做好相应的技术措施和安全措施,确保DCS和机组的安全稳定运行。

(12)  定期逐台重新启动所有人机接口站一次(建议2、3个月左右),以消除计算机长期运行的累计误差。

3.2.3 停运维护

机组检修期间应对DCS 系统应进行彻底的维护,主要包括:

(1)  利用机组检修时间逐个复位DCS系统的DPU、CPU和操作员站及数据站;删除组态中的无效I/O点,对组态进行优化。

(2)   系统冗余测试:对冗余电源、服务器、控制器、通讯网络进行冗余测试。注意观察系统停运过程中各设备停电时,主从设备切换、网络、人机接口站是否正常;系统检修重新上电后对各设备进行切换测试。

(3)  系统灰尘清除:系统停运的情况下,整个系统进行吹灰,包括计算机内部、控制站机笼、电源箱、风扇、机柜滤网等部件的灰尘清理。

(4)  系统供电线路检修,对UPS进行供电能力测试和实施放电操作。同时注意检查DPU主机卡CMOS电池电量,进行定期更换,防止因电池而引起的CMOS数据丢失。

(5)    接地系统检修。包括端子检查、对地电阻测试。

(6)    现场设备检修,根据检修维护规程,参照有关设备说明书进行。

(7)  检查DCS系统和其他系统的接口,重要信号冗余处理,与其他系统的通信视其具体情况,采取单向传输和加装防火墙措施。

(8)  系统上电:系统大修后维护负责人确认条件具备,方可上电。并应严格遵照上电步骤进行。

3.2.4 故障检修维护

系统在发生故障后应进行被动性维护,主要包括以下工作:

(1)  在日常工作中应认真按照25项反措要求,充分做好包括DPU(CPU)死机、网络通讯崩溃在内的各种事故预想,将运行紧急处理措施、安全措施、技术措施、检修步骤编写成册,确保机组的安全运行。

(2) 处理DCS故障按照制造厂应用手册中的要求开展工作,更换前确认卡件模块型号、地址(应确保与其他设备地址不冲突)、跳线等与被更换卡件一致并严格执行在线更换程序。

(3)  故障被动维护同样应严格执行工作票制度,避免抢修冒进,应结合具体故障表现进行详细分析。根据DCS系统自诊断报警、故障现象判断,找到故障点,通过报警的消除来验证维修结果。如:通信接头接触不良会引起通信故障,确认通信接头接触不良后,利用工具重做接头;通信线破损应及时更换。某个卡件故障灯闪烁或者卡件上全部数据都为零,可能的原因是组态信息有错、卡件处于备用状态而冗余端子连接线未接、卡件本身故障、该槽位没有组态信息等。当某一生产状态异常或报警时,可以先找到反映此状态的仪表,然后顺着信号向上传递的方向,用仪器逐一检查信号的正误,直到查出故障所在。

(4) 现场设备故障检修必须开具工作票,做好DCS强制和隔离措施。阀门维修时,应起用旁路阀。检修结束后及时通知集控运行人员进行检验,操作人员应将自控回路切为手动。

(5)   当出现较大规模的硬件故障、原因不明故障或超出本厂维护人员技术水平的故障时,除当时采取紧急备件更换工作外,要及时和厂家取得联系,由厂家专业技术支持工程师进一步确认和排除故障。

4
结束语

DCS应进行从设计、施工、调试、运行进行全过程全方位管理,作为系统维护人员应根据系统配置和生产设备控制情况,制定科学、合理、可行的维护策略和方式方法,做到预防性维护、日常维护紧密配合,进行系统的、有计划的、定期的维护,对运行中出现的各种故障,应具体问题具体分析。减少DCS的故障关键是要做到预防第一,保证系统在要求的环境下长期良好地运行。

第二部分

DCS系统具有较高的灵活性与扩展性。具有先进的过程操作画面(动态流程画面。分组回路画面。总貌画面。报警画面。趋势记录画面等),具有各种控制功能,运算功能,并能实现工艺参数趋势预测,历史数据显示和各种报警功能。从而实现对工艺生产全过程的集中监视、控制和管理。同时 DCS 系统的各种模块能够带电插拔、更换,这些都是常规仪表所不具备的或需要经过复杂的组合才能实现。

一、DCS控制系统故障分类

(一)硬件故障

这类故障是指过程控制层的故障,主要是DCS系统中的模块,特别是I/O模块损坏造成的故障,其次是DCS接地不牢靠,导致卡件损坏。这类故障一般比较明显且影响也是局部的,比如:参数显示没有变化,排除现场仪表故障可能后仍不能操作执行机构和电动门等。它们主要是由于使用不当或使用时间较长,模块内元件老化所致。如果模块周围的环境灰尘超标、温度高、湿度大将会大大缩短模块的使用寿命,因此鉴于DCS系统对温度、湿度、清洁度的严格要求。在安装前,操作室尤其是过程控制室的土建、安装、电气、装修工程必须完工,如在夏季,空调要及时启用。另外,尤其在管道夹层上过程控制室,其盘柜的电缆孔洞一定要封堵好,否则,一旦管道漏汽窜入盘柜,即有可能造成重大故障。

(二)软件故障

这一类故障是软件本身的错误引起的。一般出现在DCS系统投运调试阶段,因为应用软件程序复杂,工作量大,所以应用软件错误难以避免,这就要求在DCS调试试运阶段组态人员和运行人员应十分认真,及时发现并配合DCS系统调试人员解决问题,此类故障在DCS系统正常运行后很少见。第二类故障就是在系统正常运行时需增加控制点,在线修改程序导致系统出错或者死机,这就要求DCS编程组态人员对系统非常熟悉,预先做好控制方案,再进行实施,实施前必须做好程序备份,避免错误发生时,可及时挽救不必要的损失。

(三)人为故障

失误原因多种多样,有维护人员操作错误、专业水平欠佳、监护不到位、没有进行事故预想、管理有漏洞等原因。在实际运行操作中,有时会出现DCS系统某功能不能使用,但实际上DCS系统并没问题,而是操作人员操作不熟练或操作人员错误操作引起的。因此DCS系统供货厂家应及时向运行人员提供DCS操作手册,初次使用DCS系统的操作工要经过培训后才能上岗操作。

(四)仪表人员工艺流程不熟造成的故障

此种现象在各厂中普遍存在,操作员对仪表人员依赖性过大,而仪表人员平时不能进入控制室的规定实际上也制约了仪表人员对DCS的深入了解,另外由于仪表人员长时间的不接触DCS系统造成缺陷出现时不能及时准确的处理。笔者遇到过这样一种情况,一个串级均匀控制(形式上和普通串级控制一样)被操作员当作普通串级控制来设置PID参数,结果可想而知,怎么也控制不好。如果操作员能与仪表技术人员密切配合,相信仪表技术人员能分清串级均匀控制和普通串级控制的区别,从而给予操作员在参数调整方向上的指导。因此,现在仪表人员平时不能进入控制室的规定利弊兼有,如果能让部分仪表人员参与到操作员的日常工作,将会对操作员和仪表人员的综合业务素质的增长大有好处。

二、DCS系统故障防范措施

(一)DCS系统运行与管理

1.DCS系统的运行管理是指计算机系统日常点检,各种软件管理,备件管理,文件归档管理等;加强软件管理,组态的修改必须按有关规定执行,同时必须及时备份修改前后的所有组态信息,存档备查;当DCS装置发生故障,需用备件更换时,使用前必须对备件进行功能测试,以防患于未然。 
2.DCS系统检修管理是DCS系统检修时必须要有合理的检修工艺和程序,应重视DCS系统检修项目和周期,检修项目依据DCS系统设备特点,随工艺设备大修至少进行以下项目的检修:软件的备份,核实控制模件标志和地址;清扫电源、模件及防尘滤网,检查及紧固控制柜接线,接地系统检查,冷却风扇检修,电源测试;重要测量和保护信号线路绝缘检查;控制室温度、湿度及含尘量检修前测试;对UPS供电设备进行清扫,对操作站进行清扫,通讯进行检查等。

(二)UPS电源防范措施

定期用红外线测温仪测量关键接线端子的温度,做好技术档案记录,注意温升;用万用表测量主电源与备用电源电压,做好记录,注意电压波动;利用大、小修停机期间做电源切换试验。切换是否正常,切换时间间隔是否符合技术规范;电厂是一个高电压、大电流、强磁场干扰的环境,必须进行计算机接地系统的检查。

(三)DCS系统抗干扰措施

在中央控制室四周墙壁粉刷之前,先钉上一层钢丝网,再与电气保护PE接地系统相连。可以有效的防止高压输电线距离产生的强电磁场干扰。或者高压输电线改为埋地沟敷设,也可以解决高压工频强电磁场对DCS干扰的危害。中控室建筑整体结构上是钢筋混凝上梁柱顶面浇筑及砖砌墙。对DCS也具有良好的抗干扰作用。地面是水磨石上加500mm高立柱架空的抗静电活动地板。防静电接地与PE系统相连。另外,各机柜的型钢基础底座也与PE相连。采用上述措施从总体环境上对DCS的抗干扰性能起了重要的作用。 
  从现场仪表至中控室DCS的仪表电缆,主要采用钢带铠装阻燃型对绞总屏蔽或分屏蔽计算机电缆。这样对仪表电缆的抗干扰性实行双重保护:外钢带铠装层及中间接线箱外壳与就地电气接地站相连,可直接对外界起抗强电磁干扰的作用;内层铜丝编织层全部汇集到中控室IE接地母排上接地,起到了抗电场干扰的保护作用。

(四)DCS系统防病毒措施

首先确保DCS系统前期设计阶段,尽量形成局部独立的控制网络,如果有MIS系统的接入要求,可在接入公司局域网的DCS系统上安装企业版杀毒软件和防火墙软件客户端,确保DCS系统的信息安全,同时禁止插拔USB等移动存储设备,防止病毒通过其他媒体介质倾入。

(五)联锁切投管理制度

工业生产都是一种连续性生产,联锁的安全可靠性,直接影响生产和设备的安全稳定运行周期。因此所有涉及人、设备安全的联锁切除与投用都必须有相关的制度和程序去约束操作人员的行为,只有通过工艺、设备、电气、仪表DCS四方面共同认可的切除条件进行切投操作,才能有效防止设备误动作停车,长周期稳定运行。

第三部分

DCS系统是由系统软、硬件、操作台盘及现场仪表组成的。系统中任何环节出现问题,均会导致系统部分功能失效或引发控制系统故障,严重时会导致生产停车。

至于停车……带来的损失肯定不小。

实际上,相当多的DCS故障是由一些日常的小细节引起,在日常应用中,如果加强对这些小细节的管控,则可以避免相当多DCS故障带来的损失。

那么都有哪些需要注意的呢?近期小编仔细的整理了相关内容,希望能对大家有所帮助。

故障来源有哪些?

首先大家先看一下DCS经常出现哪些故障来源。

01

人为操作失误

DCS技术发展到今天已比较成熟,模块化程度也比较高,统计显示硬件本身出现故障的概率相对较低,所以DCS自身软硬件故障多半是人为造成的:由于配置不当、操作不当等人为因素造成的故障屡见不鲜。

02

信息安全

工控领域已经不再是安全的净土

03

电源故障

在自动化仪表运行的过程中,一旦发生系统电源故障,就会给DCS系统带来致命威胁。插头接触不良、备用电源无法自投、断路器容量不足、自动化仪表线路负载不匹配、供电线路事故和电路元件损坏等问题的存在都会导致系统电源故障的发生。常见影响包括电源中断、电压暂降、过电压、欠电压等。电压过高容易烧坏板卡,而电压不足则容易导致板卡无法正常工作,出现板卡故障灯报警、信号输出异常等现象。电源中断直接导致DCS系统瘫痪。

04

电磁干扰

DCS应用领域的行业特点,决定了DCS系统大多处在强电设备所形成的恶劣电磁环境中,在应用中消除干扰源和提高DCS系统自身的抗干扰能力往往是不切实际的。

05

接地不良

接地不良容易导致DCS在受到电磁干扰时出现信号跳变、信号漂移,严重时可能导致板卡受损。

05

温湿度影响

高温、低温、干燥、潮湿的工作环境都会给系统带来巨大的影响,DCS组件容易受这些环境的影响而失效或性能降低。有实验表明,对模拟量卡件,温度每变化10℃,精度将降低0.1%;而相对湿度超过65%,就会在物体表面形成一层水膜,使绝缘劣化,并加快腐蚀;相对湿度太低,合成材料容易变脆、收缩、表面龟裂易于损坏。

06

静电影响

绝缘材料表面容易积累静电:由于目前板卡都使用大规模集成电路,芯片耐压性较弱,所以静电放电可能导致板卡芯片故障。而这种损害具有一定的隐蔽性、潜伏性,容易被忽视。

07

腐蚀影响

现场的腐蚀性气体,以及一些建在海边(如核电站)受海风腐蚀,对于DCS板卡和操作站计算机等的影响往往是致命的。腐蚀比较严重的工业环境,往往会造成DCS板卡和计算机主板上的电子元器件发生短路,导致设备硬件受损。

08

雷电影响

当控制室建筑物的防直击雷装置在接闪时,强大的瞬间雷电流通过引下线流入接地装置,会使局部的地电位浮动,如果防雷的接地装置是独立的,它和控制系统的接地极如没有足够距离时,则两者之间会产生放电(反击),从而对控制室内的DCS产生干扰或损坏。

10

其他危害

包括灰尘和鼠害等,这些都会对DCS设备及线路造成严重损坏。

故障问题如何预防?

首先,在DCS安装之前必须重视工程设计及施工阶段的工作。如防雷电影响,接地屏蔽等,在DCS投运后对这些进行改造比较困难,因此出现问题后改造远不如出现问题之前做好相应的措施。设计上应选择合理的接地结构,如采用等电位单点接地方式;施工时应参照相关标准规范使用正确的接地连接方法。

其次,一些应用中发现的问题,应及时对现场进行改造。如电磁干扰问题,比较有效的措施是切断干扰源和DCS之间的传播途径。如控制室采用格栅型屏蔽,在信号线缆上加装滤波装置,确保信号线缆和电源线缆布线时遵循相应的标准规范,安装SPD装置防止雷电浪涌侵入等。

第三,必须严格按照规范进行操作。如针对静电问题,需要严格执行插拔卡件时要戴上防静电腕带的原因;使用专用的防静电袋存放板卡等备件等。

第四,日常DCS应用中需要注意:

(1)定期对DCS系统电源进行检查,对于冗余电源系统要定期进行切换实验工作。同时对UPS电源进行定期的切换检查,对电池应按照要求进行定期放电充电。定期检查网络接头和各连接线是否牢固,控制柜内的各接线端子是否牢固可靠。定期检查系统风扇是否工作正常,风道有无阻塞,以确保系统能长期可靠地运行。经常检查控制单元、I/O模块、其他模块等的工作是否正常。定期检查接地是否牢固,测试接地电阻是否符合要求。

(2)定期检查控制器、计算机等的工作负荷,并注意是否有升高现象。定期检查硬盘,并删除零碎文件,历史文件经常进行外设归档备份。

(3)对于DCS系统和其他系统的接口,建议在其他系统侧的网关站上,加装病毒防火墙,并及时更新病毒库。同时及时更新操作系统的补丁,提高系统的安全性。

(4)在运行时,原则上不再进行软、硬件的改动。

(5)对DCS系统所有的修改,无论是组态软件、系统软件还是文件属性等,都应在工程师站(记录本)有详细的文字记录。每次改动组态后都要进行把主站拷贝到副站的工作。

(6)应定期让所有的操作员站重新启动一次,以消除计算机长期运行的累计误差。养成定期备份组态软件的习惯,每次更新点目录后应该把工程师站组态安装目录下的所有文件拷贝到各个操作员站的相应目录中,否则工程师站的损坏可能会导致系统无法更新点目录。

(7)DCS控制室要保证在合适的温度、湿度、灰尘度。应定期检查工作环境和通风状况,避免通风散热不良导致的硬件故障或硬件加速老化, 一般每一个季度应该给操作员站和DPU站进行吹灰一次。

第五,要重视预防性维护,即有计划地进行主动性维护,保证系统的稳定性。利用每次大修对系统进行预防性的维护,以掌握系统运行状态,消除故障隐患。大修期间对DCS系统应进行彻底的维护,内容包括:

(1)系统供电、接地系统检修检查。定期检查UPS电池容量和充放电时间,对接地极进行接地电阻测试。

(2)在工艺允许前提下,定期对冗余电源、服务器、控制器、通讯网络等进行冗余测试。

(3)对系统卡件进行点检。彻底检查和整理以延长设备的寿命 。

(4)操作站、控制站停电检修。包括计算机内部、控制站机柜、电源箱等部件的灰尘清理。

(5)对电脑软硬件及系统进行维护。如磁盘整理。硬盘数据备份,软硬件测试等等 。

(6)对系统的网络通信的维护,确保可靠连接。

(7)系统接线端子紧固,防止接线松动。检查保险端子正常。

(8)对现场仪表设备进行检修,发现问题及时处理。

最后,一定要认真对待操作日志和故障诊断记录。

出了故障怎么办?

严格的防范并不能彻底杜绝故障,使用中由于各种因素,故障还是有几率出现的。那么DCS系统一旦出现故障,用最短时间准确分析和诊断故障部位和原因是当务之急。根据专家的经验,可以按照下列思路进行排查:

(1)彻底分析症状,这是排除故障的基础,需注意其他人关于症状的报告是否准确,最可靠的办法是亲自观察或再现症状。

(2)分析故障在什么情况下发生,发生在系统调试、联调阶段,还是正常运行、预防性维护或者诊断程序的过程中。这有助于重现故障并且隔离故障。

(3)了解是否做过一些更改。若系统之前工作正常,是否做过任何更改?包括任何硬件、软件或接线的更改。

(4)查看各板卡指示灯是否有故障报警的显示。

(5)缩小故障排查范围 可以使用标准信号发生器将标准信号(如 4~20mA信号)输入板卡,在上位机画面上查看信号显示是否正确,从而确定该板卡是否正常。

(6)通过插拔板卡或使用备件替换来判断板卡本身是否存在问题。板卡需要支持热插拔。注意重要板卡或非冗余板卡的插拔可能引起信号显示或输出异常。

(7)查看是否为暂时性或仅出现一次的问题。如果是偶然出现,有可能系统受到了干扰这种类型的问题很 难追 踪,且需要耗费很长时间,还可能需要特殊技术和专用测试设备。

(8)查看操作日志和历史故障诊断记录。操作日志可以帮助了解故障发生前后的软件操作情况,排查是否存在人为的误操作;通过历史故障诊断记录则可以了故障发生前后其他设备是否存在异常。

第四部分

DCS系统就是分散控制系统,它是结合了计算机、显示、通信、连续监测、报警、可编程控制的现代高科技技术,功能全面,操作便捷,组态灵活,稳定可靠。实践证明,DCS系统应用于大中型生产企业,不但有助于日常生产维护和可靠稳定运行,另外还能为企业节省开支,从而降低成本,提高企业核心竞争力。

1 DCS系统常见故障

1.1 通信故障

DCS系统网络拓扑方式以及采用的通信协议多种多样,但就市场上不同品牌的DCS系统在网络组织架构上大多都分了两个层级:其一面向中央处理器以及其下的拓展分站(下位机),其二则是人机界面,诸如操作员、服务器、操作员站的各种站点(上位机)。通信故障通常表现为这样几种形式:系统死机、脱网、通讯中断等等。造成通讯故障的原因,常见的有以下三种:首先,DCS系统通信功能的运行大都是通过一个节点向另一个节点问询数据完成的,如果另一个节点没有该数据,它会一遍又一遍询问,直至读取数据,倘若网上并无此数据,网络就会被堵塞,通信就无法正常进行。其次,DCS组态欠缺,其应用软件伴随着科技的发展一直在增加,但实际上并没有和I/O点连接起来,因而CPU在读取数据过程中,即使读取了数据,但有效的也很少,这就给CPU带来了相当大的负荷,很容易造成网络被堵塞。最后,网络通信介质出问题、硬件升级驱动程序跟不上、运行环境温度过高等等因素都可能给通信造成阻碍。

1.2 硬件故障

硬件故障一般表现在过程控制层中,主要是整个系统中的模块,尤其是I/O受到了损伤。硬件故障表现会十分明显,所以比较容易察觉,它带来的影响通常只是局部的,像参数显示不变化就是硬件受损的表现。硬件受损多由于使用不恰当或者是使用时间太长导致原件老化所致。倘若DCS周边环境多尘、高温,会严重缩短其使用寿命,考虑到这一点,在安装DCS控制系统之前,最好保证土建、装修工程已经完工,倘或是在夏天,还要注意及时开启空调,或者在对DCS系统产品进行选型时针对复杂环境应重点考虑防护等级的问题。目前市场上很多品牌的DCS产品都已经开发了硬件的自诊断功能,可以直接在上位机上反映出出现问题的硬件所在位置,还可具体到哪一个通道出现故障,也对排除硬件故障带来了很多便利。

除了通道故障,硬件故障中也存在人机接口故障,人机接口故障具体表现有:鼠标无法正常操作,因为失效,所以操作人员使用非常不方便,造成这一状况的原因,可能是USB接口不稳定,也可能是计算机主板有问题。死机可能是因为DCS系统软件本身存在缺陷,也可能是因为CPU负荷太大所致,当这种情况发生的时候,要耐心分析其原因。功能键盘操作失灵,有时候会出现按键接触不良的情况,这时候键盘操作就不正常了。

1.3 软件故障

软件故障通常都是由DCS系统本身缺陷所造成,大都出现在DCS软件升级阶段初期。软件是DCS系统最复杂的一个部分,程序复杂,组态工作者多是交叉作业,如此一来,一旦沟通不到位,就会出现漏洞,软件错误就不可避免。DCS系统软件修改需要严格遵照规定执行,同时针对修改进行备份,如遇数据丢失,就可以借助备份进行修复。软件故障主要有以下三种:主CPU和从CPU的组态信息不相一致,致使CPU无法完成初始化;网络通讯压力过大,造成系统混乱;某元件更新后,相关的参数没有相应改变。

1.4 电源故障

电源故障会直接导致DCS系统控件功能失灵,停止运作,造成经济损失,控制电源不夸张地说就是DCS系统的“生命线”。一些尤其重要的电源如果发生故障,就会直接影响到保护逻辑以及其他控制逻辑有序稳定的工作,甚至会导致一些连锁关系的驱动元件误动作,造成严重生产事故。电源常见故障有:(1)接线头压接不牢或者接插不稳,出现接触不良状况;(2)CPU出现问题或者是保险配置不合理,使电源被切断;(3)电源线布线缺乏科学性,与那些有着强烈磁干扰的设施距离过近;(4)种种原因导致模件损伤。

2 预防措施

2.1 抗信号干扰

即使是轻微的信号干扰,也可能造成通信故障,影响系统工作,引发系统瘫痪,或者信号干扰直接干扰到进DCS的信号,从而产生误动作等等都会带来巨大损失,如何更好地抗信号干扰,可以预防采取这样一些措施:第一,在粉刷中央控制室四周的墙壁之前,有必要安装一层密集的钢丝网,接着再与PE接地系统相互连接起来,这样就可以有效避免强电磁场巨大的干扰。第二,动力设备最好不用串联的方式让它们接地,尽可能地让动力设备与接地线保持距离。第三,采用双回路冗余电源系统为DCS供电,始终保持UPS一直供电不间隔,提高电源、电路的总体抗干扰水平。第四,所有模拟量信号进DCS系统都必须用屏蔽电缆连接,屏蔽层需专门做好屏蔽接地,其对地电阻必须在1Ω以下。第五,尽可能屏蔽DCS系统周围的无线电。

2.2 UPS电源维护

定时借助红外线测温仪测量关键接线端子的实际温度,同时予以详细记录,如果有升温,要格外留心;借助万用表对电源电压进行测量,记录数据,如有波动,要格外留心;DCS系统检修或者停机阶段,及时进行切换实验,监测冗余CPU能否自动切换并处于正常工作状态;检查I/O模件,一些老化和腐蚀的电气连接件要及时更换;严格遵照电池使用规则进行充电或者是放电;对风扇进行检查,必要时进行清理,使风道能够畅通无阻。

2.3 DCS软、硬件系统运行和管理

2.3.1 运行管理。所谓的运行管理就是指日常巡检、软件管理、备件管理等等。软件是DCS系统的核心,程序复杂,其组态和修改都必须依照规定执行,同时备份修改信息,防止因数据丢失所引起的故障;倘若遭遇DCS装置出现问题,需要用备件进行替换,安装使用之前,一定要对其功能有一个全面测试,避免整个系统故障再次发生。

2.3.2 检修管理。检修管理重视检修工艺和检修程序,为了使DCS系统的稳定运行质量有所保障,能够长时间正常作业,必须定时定期进行大检修,例如软件备份、清扫电源、零部件清洁等等。

伴随着科技的发展,DCS控制系统日臻成熟完善,并越来越广泛地应用到各个工业生产领域,成为其中不可或缺的自控设备,DCS强大的功能,为工业生产带来了巨大的经济效益。

第五部分

某厂DCS一般故障维修作业指导书

DCS担负着公司的主要生产任务,是仪表维护的重点设备,为了保证这些仪表设备的安全运行及出现故障后能迅速有效的进行维修特制定此DCS故障作业指导书。

一:操作站故障

操作站作为人机接口,是操作人员对生产现场进行监控的主要设备,是人为操作最频繁的部分,也是最容易出现问题的地方。

 1、操作站硬件故障: 操作站硬件故障主要指计算机硬件故障,包括主机、显示器、鼠标和键盘等外围设备,检修时主要根据故障现象,采取替换法和排除法。具体步骤如下:

A、做好DCS软件系统软件和组态文件的备份;

B、观察DCS操作站显示故障信息或现象,初步判断故障所在;

C、关闭计算机和显示器电源,并拔掉电源或空气开关;

D、带防静电手套,更换故障硬件;

E、打开电源,启动计算机,判断是否恢复正常;

F、如处理正常,DCS操作站投用,并观察24小时,如还没有正常,继续执行以上步骤,直到找到故障原因并处理。

2、操作站软件故障: 操作站软件故障主要有操作系统软件故障和DCS系统软件故障,这类故障是最易发生,也是经常要处理的,具体处理步骤如下:

A、做好DCS系统软件和组态文件的备份;

B、准备好操作系统软件,硬件驱动软件(包括显卡、声卡、网卡、鼠标等),DCS系统软件;

C、重启计算机,看能不能恢复正常,大部分的问题都可以恢复正常;

D、如没有恢复正常,判断是操作系统的原因还是DCS软件的原因,根据需要重新安装相应的软件,特别要指出的是安装时必须按安装说明书的步骤进行安装,并要满足软件的安装要求,比如操作系统需要打到补丁多少版本等;

E、恢复组态文件到DCS操作站,并启动操作站,观察24小时。

二:控制站故障

控制站是直接参与控制的核心部件,主要故障有控制器故障,I/O卡件故障,通道故障,电源故障。

1、控制器故障

DCS控制器是控制站的核心,一般是带冗余的,如果控制器出现故障,将导致整个控制站不可用,出现故障后处理过程如下:

A、联系工艺人员作好停车处理方案;

B、准备好要更换的控制器;

C、作好组态数据的备份;

D、戴好防静电手套;

E、拔出坏了的控制器,换上好的控制器;

F、上装组态好的数据;

G、作好主控制器与冗余控制器数据的同步。

2、I/O卡件的故障

I/O卡件故障包括I/O处理卡和端子板故障,处理步骤:

A、联系工艺人员把与这个故障卡件有关的仪表切出去,改现场手动控制;

B、查找故障发生在哪里,是I/O处理卡故障、端子故障还是它们之间的连接排线故障;

C、准备好相应的配件;

D、戴好防静电手套;

E、更换卡件;

F、观察卡件运行情况,如没有问题,联系工艺人员投用仪表回路。

3、  通道故障

通道故障产生的原因主要是现场强电进入,烧坏了通道元件或保险管,如果是保险管坏了,更换,如果是通道元件损坏,无法短时间恢复,可以采用更换通道。步骤如下:

A、查找空余的通道;

B、更改通道连接线;

C、更改组态到新的通道;

D、投用仪表。

 4、电源故障

电源系统是DCS可靠运行的重要保障,它为控制器和I/O卡件供电,一般带有冗余,出现故障后处理步骤如下:

A、准备好备用电源;

B、如能断电处理,可关闭电源开关,如不能断电处理,必须要注意防止短路,同时要注意直流电正负对应,交流电要同相,否则就可能烧掉电源,造成设备损坏;

C、投用电源,用万用表检查电源的输出是否正常。

三:通讯故障

DCS的通讯包括通讯电缆、通讯卡件,其故障发生频率较高的通讯电缆的故障。

1、 通讯电缆的故障

通讯电缆的故障包括终端接头故障和电缆本体故障,处理步骤如下:

A、对电缆进行测试,判断电缆是否正常,如不正常,更换电缆,如电缆正常,检查终端接头,看是否是接头松了,是否生锈了,接触不好,造成的通讯故障和误码率增加;

B、采用专用工具拧紧接头或专用清洗液除锈;

C、清除DCS上的误码率数值为0,观察误码率数值是否增加,如不增加,说明恢复正常。如还增加,检查周围是否有大的干扰源。

2、通讯卡件的故障

通讯卡件包括操作站通讯卡和控制站通讯卡,有专用的通讯卡和通用的以太网卡。处理步骤如下:

A、关闭通讯卡所在设备的电源;

B、首先检查通讯卡参数是否设置正确,如不正确,更改参数,如正确,可以采用测试软件测试通讯状态,如果是通讯卡故障,更换通讯卡,并设置好正确的参数。

四:维修设备及材料

序号 名称 数量 备注

1 防静电手套 1副

2 数字万用表 1块

3 活动扳手 2把

4 一字螺丝刀 2把

5 十字螺丝刀 2把

6 毛刷 2把

7 移动硬盘 1 个

8 DCS备件 一套

9 DCS资料 一套

五:维修注意事项

DCS系统作为一个大的仪表控制系统,它关系到分厂的安全生产,如检修不当,将产生极严重的后果,不断影响生产,有可能把故障扩大,造成更大的损失,根据DCS系统的特点,在对DCS系统进行检修时要注意以下几项:

1、DCS的组态数据很多,如组态数据丢失,重新组态的工作量巨大,所以检修前要作好组态数据和系统的备份;

2、一套DCS系统牵涉到的装置和岗位很多,必须联系工艺人员作好事故处理方案,在检修出现问题时,工艺人员可以保证装置安全运行;

3、DCS采用的都是大规模集成电路,静电对它的危害很大,因此在检修时必须戴防静电手套或把手上的静电放掉;

4、检修时必须细心、仔细,作好详细的检修步骤,要抓住故障的所在,不能搞错卡件或电缆,造成整个DCS系统崩溃;

5、DCS系统设备故障,主要采用排除法,而且维修很复杂,所以要准备充足的备品备件。

(0)

相关推荐