一舟集团

首页 > 服务支持 > 一舟案例

农商行数据中心感染32例你所不了解的IDC运维工作

农商行数据中心感染32例你所不了解的IDC运维工作

来源:江南体育官网    发布时间:2023-12-18 01:02:45 1
然而,高规格的硬件并不能确保数据中心的安全性。根据统计,数据中心七成的事故都是人的因素造成的。人的因素属于数据中心运维管理范畴。数据中心运维管理包括运维组织、运维基本制度、运维流程和运维价值提升等

  然而,高规格的硬件并不能确保数据中心的安全性。根据统计,数据中心七成的事故都是人的因素造成的。人的因素属于数据中心运维管理范畴。数据中心运维管理包括运维组织、运维基本制度、运维流程和运维价值提升等。而运维流程又包括事件管理、问题管理、变更管理、维护管理、故障管理、场地配置管理、设备生命周期管理、应急管理、质量管理、成本管理和安全管理等。

  也许你会认为运维管理上的疏忽,也许没什么影响。毕竟大部分数据中心配电系统是2N架构,通过高冗余可以使可用性达到4个9以上。然而,没有经过系统培训的运维工程师在应急处置情况下容易犯错,就可能会引起停电宕机。宕机意味着什么?对于金融等特定行业而言,就是以秒计算的损失,时间就是金钱。

  在整个数据中心生命周期中,数据中心运维管理是历时最长的一个阶段。数据中心运维管理最大的目的是为提供符合标准要求的系统服务,而对与有关的数据中心各项管理对象进行系统的计划、组织、协调与控制,是数据中心运行服务有关各项管理工作的总称。运维管理是数据中心业务的重中之重,然而,在实际在做的工作中却有诸如人才、技术、需求等多重阻碍因素,极大地影响了运维管理的工作效率。

  首先,数据中心市场近年来蒸蒸日上,数据中心服务商对专业化人才的需求量迅速扩大,专业化人才供不应求的矛盾十分突出。一方面,行业快速地发展,新技术快速更新,而部分早期从业人员知识结构老化,缺乏业内相关专业资质认证,以至于部分人员不适应新的行业环境要求;另一方面,新增人才补给速度跟不上行业加快速度进行发展形势。数据中心服务商如无法招聘到合适的专业化人才,势必对其数据中心运营产生不利影响。

  值得一提的是,北京市顺义区农商行数据中心近日发生聚集性疫情,造成数十人的感染病例,涉及多个行政区,引起了社会的广泛关注。在疫情防控的特殊时期,数据中心人员怎么来实现做好基础设施保障工作的同时,又能够以最少的在岗人员兼顾疫情管控的要求?

  如此看来,一支经验比较丰富的运维团队价值日益凸显。以企商在线年的IDC基础运营商,企商在线名以上的工程师和技术人员,不仅运维团队经验比较丰富,而且在培养技术新人方面颇有心得。新入职员工需要接受为期三个月的标准化技能培训,其培训内容均由具有一线实战经验十年以上的老员工负责整理,将其经历建设、验收测试、处理大大小小的故障的切身经验作为培训课程加以传授。其中,应急预案EOP 24种,设计场景45个,标准化操作流程26类,标准化维护指导书超过20个。可以说,想要在企商在线的数据中心做个合格的运维人员并非易事,而零事故只是企商在线运维工作的最低标准。

  正是通过这样的技能培训方式,将老师傅的资深经验薪火相传,快速缩短了通过经验培养运维人才的时间,并依托整体的体系化培训进行实操、技能提升,让新人提前获取足够的经验,培训后经考核方可上岗,有助于新人迅速成长为技术骨干。

  其次,随着网络发展的不断深入和互联网应用的不断多元化,互联网数据规模呈指数级增长,对互联网数据中心的需求也将呈现指数级的增长。为满足当前互联网基础设施的需求,数据中心还将不断进行扩建,数据中心规模仍将保持上升的态势,这就对数据中心建设规模、承载业务以及存储与计算等技术提出了更高的要求,运维管理负担重等问题凸显。与此同时,数据中心承载业务的一直在变化,以及计算虚拟化、存储虚拟化等技术的应用,使得数据中心流量快速地增长,对数据中心内部网络管理和性能提出了更高要求。

  基于此,IDC 厂商需要对基础 IT 资源进行自动化集中管理,使行业客户无需负担高昂的数据中心管理成本,由平台实施资源调度,将资源流转到需要的地方。在系统业务整体升高的情况下,管理平台可以启动闲置资源,提高整个平台的承载能力;在系统业务负载下降的情况下,平台可以将其他闲置的资源转入节能模式,提高资源利用率,达到绿色、低碳的效果。IDC 厂商要解决不一样的客户数据之间的安全隔离,将不同用户进行安全切分,避免被外部用户恶意攻击。IDC 服务商必须要有强大的网络安全技术,以保障用户的信息安全。

  从建设模式上来看,企商在线采用自建模式,从用地、到建筑、到机房设计,到投入到正常的使用中,其周期比较长,但在建筑和数据中心匹配程度上,自建数据中心更胜一筹。为应对客户的个性化需求,企商在线对部分机房进行了定制化改造或建设,二十余载的服务积累了丰富的定制化数据中心经验,采用绿色节能技术和云计算技术架构,符合The Uptime Institute 及 ANSI/TIA-942-2005 T三级标准。在新冠疫情常态化以来,企商在线的运维团队在工作中通过智能化的运维手段进行了技术储备,做好了各种应急预案,并实现人员远程协助办公,使得数据中心的运维工作能够最终靠最少的人员保障正常运作,并按照地区防疫办的政策要求,积极采取准封闭和封闭的管理措施和组织内部应急演练,要求随便什么时间都能做到封闭管理,非必要不出园区,可在兼顾疫情防控的要求下实现数据中心的正常运维。

  在疫情防控的特殊时期,创新型应用场景的作用非同小可。从技术角度而言,企商在线一直走在数据中心创新应用的前沿。以企商在线燕郊数据中心为例,该运维平台设计规划60人座席提供网络、负载、生产能力、 电力、温度、安防监控,实时推送。具体而言,企商在线计划通过IT运维管理可视化,可以对数据中心内所有网络设备、应用系统、操作系统等进行安全监测,通过3D机房可视化、安全态 势可视化、信息资产可视化等方式,帮助运 维部全方位感知数据中心园区网络安全态势,可实现高效的预测管理以及容量管理。此外,企商在线打造出一整套安全运维智能化管理解决方案,并建立高效的运维机制,完善的日常巡检机制,故障演练机制。日常排除运营风险,如遇风险发生,第一时间相应,快速处理故障。企商在线 的不间断客户服务,极速响应客户的真实需求,并可实现数据中心SLA传输高标准承诺,可为客户提供金融级绿色高效数据中心服务。

  实际上,数据中心稳定性不仅受限于运维管理上的水准,也受系统架构、设备品牌等因素影响。因此,燕郊金融大数据算力中心在建设伊始,就按照T3及以上级别规划数据中心基础设施系统架构;在设备品牌方面,企商在线优选国际一线品牌、国内一线品牌设备供应商,从设备端降低故障发生率;在测试验证方面,则通过综合测试验证数据中心可用性,排除建设过程中的缺陷,减少运维过程中的隐患。

  有行业专家这样认为,以北京为例,当前已有很多数据中心已确定进入“中老年期”。对于这一类数据中心而言,有几率存在以下两方面问题:其一,是当初的规划设计已经不满足目前市场环境需求的问题。目前,市场环境所需要的数据中心,应当是单机柜供电密度相对更高、能效利用水平更好的数据中心,然而,很多中老年数据中心就输在了起跑线上。同时,能效利用水平的较低会导致企业经营成本的升高。其二,是设备的折旧问题。甚至有可能是因为运维管理的不足,导致设备提前折旧,而这样的一种情况并不鲜见,运维可靠性很难得到保障。

  因此,想要保障业务的高效顺畅运转,选择一直拥有经验比较丰富的运维团队至关重要,与此同时,选用一家按照行业高标准倾力打造的最新数据中心亦是大有裨益。想淘汰掉“中老年”数据中心的,请关注燕郊金融大数据算力中心。7月正式上线,虚位以待。

评论一舟