ITIL事件管理流程设计
公众号回复:干货,领取价值58元/套IT管理体系文档公众号回复:ITIL教材,领取最新ITIL4中文教材正文事件管理流程是ITIL主要流程之一,它的主要目标是尽快解决日常工作环境中出现的事件,保持IT服务的稳定性,监控事件的发展,并在事件得到解决之后将其关闭。谈到事件流程我们需要了解一常见术语:NO术语定义1事件服务的意外中断或服务质量的下降。尚未影响服务的配置项失效也是事件,例如镜像组中一块磁盘的失效。2服务请求用户对信息、建议、标准变更或服务访问的请求。例如重置密码、为新用户提供标准的服务。服务请求通常由服务台处理。3重大事件对业务有重大影响的事件,重大事件将导致重要业务的中断。一般事件影响度或优先级为1级的事件默认定义为重大事件。4升级在需要时获得额外资源,以达到服务级别目标或客户期望的活动。任何服务管理流程内部都可以升级,但是升级常常与事件管理、问题管理和有关客户投诉的管理有关联。主要有两种类型的升级:技术升级和管理升级。5管理升级通知更多的高级管理人员或使他们参与解决疑难问题升级。6技术升级将事件、问题或变更转给具有更高技术的小组,以便进行疑难问题升级。7响应时间一种衡量完成运营或交易所需时间的指标,在性能管理中一般用于测量 IT 基础架构的性能,但在事件管理中主要用于测量接起电话或开始诊断的时间。8目标解决时间为了更好的控制事件、变更等流程的整个处理过程,将处理过程被划分成几个阶段,并对每个阶段的完成时限设定了目标,即目标解决时间。9紧急度测量事件、问题或变更多久会对业务产生重大的影响。例如,如果事件到年底才会影响业务,则影响大的事件可能紧急程度较低。指定优先级时要考虑到影响度和紧急度。10影响度事件、问题或变更对业务流程影响的一种测量,影响度通常基于服务级别会如何受影响。指定优先级时要考虑到影响度和紧急度。11优先级用于确定事件、问题或变更的相对重要性的类别。优先级的依据是影响度和紧急度,用它来确定采取行动所需的时间。例如 SLA 可以规定:优先级 2 的事件必须在 12 小时内解决。12挂起事件、变更等流程可能因非技术原因而无法进行下去,此时可以暂停计算流程处理时间,挂起的目的在于更加公正的统计流程处理时间等与流程处理人员相关的指标。13临时措施也称“变通方案”,在还没有完全的解决方法时,减少或消除事件或问题的影响。例如重新启动发生事件的配置项。14知识管理负责收集、分析、保存和共享组织内部的知识和信息的流程。知识管理的主要目的是通过减少重新发现知识的需要,从而提高效率。15知识库一个逻辑数据库,其中包含了服务知识管理系统使用的数据。以下是事件流程设计图:
事件流程中的主要角色和职责的说明:角色职责描述对应岗位报障人l 向服务台提交所发现的需要处理的事件。l 与服务台确认事件处理结果。所有可以发起事件的人服务台l 接听热线电话,响应用户报障需求,对用户进行初步相应的指导解决。l 响应用户通过邮件、微信以及手机APP等方式的报障需求。l 快速响应报障需求,为用户提供高效的远程服务。l 及时联系现场工程师为用户提供服务。l 及时联系二线支持人员为用户解决问题。l 在ITSM平台中准确并及时录入事件信息。l 对事件进行全程跟进,直到解决。l 负责在事件解决后生成问题单或录入知识库(FAQ)。客服二线指派工程师l 响应服务台派出的事件单,提供现场服务,包括备件更换安装服务。l 在ITSM平台中准确并及时录入事件处理详细信息。l 需要时发起服务请求单或变更单。l 负责升级必要的事件到三线工程师或者供应商。l 负责在事件解决后生成问题单或录入知识库。三线指派工程师l 响应二线工程师升级的工单,提供现场服务,包括备件更换安装服务,系统支持服务,工程服务等。l 在ITSM平台中准确并及时录入事件处理详细信息。l 需要时发起变更单。l 负责在事件解决后生成问题单或录入知识库。供应商l 负责响应由二线或三线升级的事件单。l 对事件单信息进行分析,并提供相应的解决方案。外部设备供应商与服务提供商。事件经理l 设计和改进事件管理流程。l 设定事件管理的绩效指标并考核指标完成程度。l 跟踪、监控各事件流转状态,抽查事件记录。l 收集汇总流程信息,编制管理报告,反映存在问题,提出改进建议,制定改进计划。分管领导l 接收事件经理升级的重大事件。l 必要时与事件经理共同跟进重大事件,协调资源。l 审批重大事件报告。整体流程总共三大阶段:识别记录、调查诊断、解决关闭,各阶段详细说明如下:一、事件识别与记录步骤名称责任人说明1.1提交事件报障人报障人通过电话、微信、邮件或手机APP来进行报障。1.2识别和记录服务台服务台在ITSM平台中进行事件信息的记录,包括用户联系方式、事件描述、事件分类分级等;若用户通过非电话的方式进行报障,服务台工程师可电话联系用户进行更多信息的确认和收集。1.3通知事件经理服务台事件经理若事件级别判断为一、二级事件,需要升级至事件经理需要跟进事件的处理过程;同时事件经理需要上报分管领导。二、事件调查与诊断步骤名称责任人说明2.1初步处理服务台服务台对事件进行初步处理,进行远程调试或指导。2.2是否可以解决?服务台若可以解决,则直接处理解决,并进入3.2,与用户确认是否恢复;若无法解决,则进入2.3寻求二线支持。2.3二线支持团队调查诊断,寻找解决方案二线工程师二线支持团队接受服务台升级的事件,并判断是否需要进行内部转派,如需要则说明转派理由,并进行转派,如不需要则对事件进行分析和处理,处理过程需要及时更新到平台中;若需要执行变更,则触发变更管理。2.4是否找到解决方案?二线工程师若是,则进入2.5 是否需要发起服务请求管理;若否,则进入2.6寻求三线支持;若否,则进入2.8 寻求供应商支持。2.5是否需要发起服务请求管理二线工程师找到解决方案后,是否需要继续发起服务请求管理,寻求彻底解决:若需要执行服务请求,则发出服务请求管理若不需要,则进入3.1 事件解决。2.6三线支持团队调查诊断,寻找解决方案三线工程师三线支持团队接受二线升级的事件,对事件进行分析和处理,处理过程需要及时更新到平台中;若需要执行变更,则触发变更管理。2.7是否找到解决方案三线工程师若是,则进入3.1 事件解决;若否,则进入2.8寻求供应商支持。2.8供应商团队诊断调查,寻找解决方案供应商供应商接收来自二线和三线对的事件,并对事件进行分析诊断,给出最终解决方案。2.9提交解决方案供应商供应商将解决方案提交给相应的升级人员,由其去解决事件,并进入3.1 事件解决三、事件解决与关闭步骤名称责任人说明3.1事件解决二线工程师、三线工程师将事件的解决结果及时更新至平台中,并标记解决,必要时发起问题工单进一步分析,或发起服务请求单完成临时解决后尚需进一步完善的遗留状态,或将事件总结生成知识库条目。3.2是否恢复?服务台服务台与用户确认事件的恢复结果。3.3填写用户反馈和满意度服务台将用户反馈和满意度调查情况更新至平台中,并关闭工单。要落地实施好事件流程需要考虑的重要原则策略:1. 所有已识别的事件都要被记录,所有事件都有整体责任人(服务台受理者),指派责任人(二线相关条线的主要负责人或受理人),以及当前执行人(具体负责该事件处理人),升级对象(三线或供应商)。2. 事件首次响应的服务台(客服人员)负责在平台中记录此事件的详细信息,并进行初步支持,并作为此事件的最终负责人,负责跟踪事件处理的整个过程直至事件解决,以确保事件处理过程有专人及时跟进;3. 原则上所有事件需要经过服务台。监控所发现的事件暂时不经过ITSM系统进行管理;4. 若因情况紧急无法及时记录时,可进行事后补单,但补单时间不得超过12小时;5. 原则上,所有事件首先指派给二线,如事件指派不准确或正好遇上交接班时间,该事件可在二线团队中做转派。如需要进一步支持,再由当前指派人升级给三线,二线三线都可以联系供应商解决,但只有三线可以进入ITSM系统操作(供应商不纳入ITSM使用者行列),当事件升级到三线后,二线的当前执行人仍为该事件的当前责任人。6. 原则上,服务台、事件经理、指派工程师可根据实际情况对事件分类、分级等信息进行调整。7. 服务台人员应在事件解决后2个工作日(48小时)内与报障人联系并关闭事件。如果报障人收到通知,且在2个工作日(48小时)内未对事件处理结果未提出异议,默认事件报告人接受结果,事件可关闭;8. 导致事件发生的根本原因未知,或者事件重复发生,以及发生了重大事件,指派人都应提交问题管理流程查找根本原因,以期找到解决方案和预防措施;10. 所有指派责任人都有义务根据事件处理情况更新相关知识库。最后看看考核事件流程质量的一些关键绩效指标:绩效指标目标值衡量方式负责人事件总数事件总数/周期(年,月,周,日)服务台、二线工程师、三线工程师事件关闭的数量/比率关闭事件数量 / 周期数量 / 事件总数 × 100 %服务台、二线工程师、三线工程师事件自动关闭的数量/比率自动关闭事件数量 / 周期数量 / 事件关闭数量 × 100 %服务台重大事件数量/比率优先级为一/二级事件数量 / 周期数量 / 事件总数 × 100 %事件经理事件成功关闭的数量/比率成功解决事件并关闭数量 / 周期数量 / 事件关闭数量 × 100 %服务台、二线工程师、三线工程师临时解决事件的数量/比率变通方法解决事件并关闭数量 / 周期数量 / 事件关闭数量 × 100 %二线工程师超过规定时间响应的事件数量/比率一线响应超时事件 / 周期数量/事件总数 × 100 %服务台超过规定时间解决的事件数量/比率超时解决事件 / 周期数量/事件总数 × 100 %二线工程师,三线工程师,供应商首次派单成功率未派回服务台重派单事件 / 事件总数 × 100 %服务台平均响应时间累计响应事件的时间 / 事件总数服务台平均解决时间累加完成事件的时间 / 完成的事件数二线工程师,三线工程师,供应商一线解决率一线解决事件数量 / 事件成功关闭总数 × 100 %服务台二线解决率二线解决事件数量 / 事件成功关闭总数 × 100 %二线工程师用户满意度事件记录中用户满意度分值总计 / 事件总数服务台需要原始事件管理流程设计WORD文档扫描下方二维码加入社群获取福利圈子构建、学习资料获取1000+份【ITIL/数字化转型/IT管理各类文档解决方案报告】,欢迎加入知识星球(扫下方二维码)~~~更多推荐ITIL配置管理实施常见问题总结ITIL配置管理实施方案详解(二)ITIL配置管理实施方案详解(一)ITIL流程实施系列之变更管理ITIL4基础认证培训教材之普通管理实践