一舟集团

首页 > 光纤系统 > 一舟光纤布线

TCECS761-2020《数据中心运行维护与管理标准》主编解读(三)事件和变更流程

TCECS761-2020《数据中心运行维护与管理标准》主编解读(三)事件和变更流程

来源:江南体育官网    发布时间:2024-01-04 13:37:25 1
原标题:T/CECS761-2020《数据中心运行维护与管理标准》主编解读(三)事件和变更流程 数据中心的运维要建立运行、维护和管理的工作制度和流程。支撑数据中心开展正常的运维流程基本上

  原标题:T/CECS761-2020《数据中心运行维护与管理标准》主编解读(三)事件和变更流程

  数据中心的运维要建立运行、维护和管理的工作制度和流程。支撑数据中心开展正常的运维流程基本上包括:服务台、事件管理、变更管理、问题管理四部分,本讲重点介绍事件、变更两个流程的要点。

  事件管理是数据中心运维管理的重要流程,事件管理包含了事件的发现、事件的处理、事件的恢复和事件的回顾。在事件管理流程中应关注以下的环节:

  数据中心每天都有许多服务请求,这些请求统称为事件,通常这些事件分为业务、工作需求和运行故障三种形式,本标准侧重于运行中发生的故障事件的处理管理流程,因为这类的事件将导致服务中断,会引发财产的损失、用户的利益、企业的声誉。

  在数据中心运维中,通常是按照系统来进行事件的分类,同时需要对事件进行分级,分级的目的是针对不一样等级的事件,调用相应的资源加快处理的速度和控制事件事态的升级,减少服务中断的时间和损失。目前不一样的行业或单位对事件分级是有不同的方式,比如事件对服务的重要性、事件影响面、事件造成的损失、事件的维持的时间、与用户签订SLA协议要求等等。如何制定事件的分级,本标准给出了容忍度的分级方法论,事件的分级见下表:

  在数据中心运行中,会出现多个事件同时发生,需要优先处理重要的事件和紧急的事件因此就需要制定事件处理的优先级,加快服务处理的时效和提升服务质量。事件优先级要关注两个维度:一是影响度,影响度是指影响用户服务的范围、业务的数量和造成的损失;二是紧迫性,紧迫性是指事件对应的服务级别、服务系统的重要性、事件的维持的时间等。

  在处理事件时,会出现随着事件处理时间增加导致事态的扩大,或者在处理事件中引发新的事件,因此就需要对事件进行升级。

  职能性升级:调动更多的资源(高级、资深或厂家的技术人员、跨部门跨地区的协作)加快事件的处理。

  结构性升级:升级到上级或更高的管理部门,通过管理层的权力调动需要的资源,加快事件的处理速度,并做好与受影响用户的沟通。

  在数据中心运行中会有大量的变更,比如设备的维护保养、更换耗材、设备测试、新系统上线、改造或扩容、故障原因查明后的修复等等,很多系统的变更会需要撤离生产环境或停机处理,有些变更会引发系统宕机的风险,因此就需要建立变更的管理流程,控制和降低变更带来的运行风险。

  按照变更对运行的影响程度,本标准将变更分为紧急变更、例行变更和标准变更三类。

  紧急变更:上班时间采用一事一审批的方式;非工作时段可采用电子(电话、短信、微信等)审批方式,事后补办流程。

  例行变更:可采取定期(如年度)集中预批准的方式,对例行变更请求,集中审核、审批,一次审批年度内有效。

  标准变更:采用一事一审批方式,也能定期或不定期召开变更请求审批会,多个变更请求进行审核和排期审批。返回搜狐,查看更加多

评论一舟