智能楼宇

数据中心风险评估对您下一个项目的价值

Shad Sechrist

对于数据中心来说,风险’不仅仅意味着计划外停机—风险还可能意味着收入损失、设备损坏、客户不满甚至生命危险。

 

降低数据中心风险首先要回答一个简单的问题:什么会影响关键系统和数据?

 

在项目开始之前,数据中心风险评估和分析可以通过识别潜在的数据中心风险来揭示这个问题的答案, “有风险” 这些风险的真实情况(如果发生这些风险,会对业务绩效产生多大影响)以及如何减轻这些风险发生的可能性。

 

尽管消除所有潜在的停机原因是不可能的—人为错误、网络安全威胁、自然灾害、服务器故障等等—它’采取措施进行数据中心风险评估以降低可能导致停机的普遍风险更为实际。

 

在新的数据中心项目中,可以通过在数据中心设计和规划过程中做出的选择来减少这些对正常运行时间的威胁。首先要确定数据中心’正确的可用性等级。了解这一点将指导您了解项目的最低性能和可用性要求。

 

数据中心’秒 “可用性” 指其执行预期功能的能力。这个数学表达式表示系统可用性。

 

正常运行时间 / (正常运行时间 + 计划停机时间 + 计划外停机时间) = 可用性

 

在此方程中:

 

  • 正常运行时间和停机时间以时间单位在特定时间段内衡量
  • 计划停机时间包括预防性维护、设备设置、升级、测试和优化等事项。
  • 计划外停机时间包括因故障导致的维修、维护延期和设施相关故障或停电等。

 

ANSI/TIA-942 将数据中心分为 四个级别 根据数据中心的设计和建造方式,使用电信、电气、建筑和机械评级:

 

  • 额定 1: 单容量组件和单一非冗余分配路径
  • 额定 2: 冗余容量组件和单一非冗余分配路径
  • 额定 3: 冗余容量组件和多个独立分配路径
  • 额定 4: 冗余容量组件和单个独立分配路径

 

正常运行时间协会使用四级方法对数据中心进行分类,该方法表明了必要弹性等级:

 

  • 第1级:基本容量等级,只需一个用于停电的不间断电源(UPS)、一个用于IT系统的区域、专用冷却和一个发动机发电机
  • 第 2 层:电源和冷却的冗余容量组件
  • 第 3 层:可同时维护冗余组件
  • 第 4 层:独立且物理隔离的系统,充当冗余容量组件和分配路径

 

要确定您数据中心项目的正确可用性等级,需回答三个问题。

 

1.数据中心’的运营要求?

 

考虑进行计划维护停机的可用时间。这包括关闭系统、关闭系统以及解决维护问题和疑虑的时间。如果数据中心必须全天候运行,并且’承受任何时间 计划维护 关机,然后’它很可能是一个 Tier 4 数据中心,需要为每个组件提供内置冗余。

 

2.什么是数据中心’的运行可用性?

 

确定数据中心’s 操作可用性要求(数据中心必须能够不间断提供支持的总时间)。

 

这就是短语 “九成的可用性” 开始发挥作用。可用性通常以 9 秒表示。例如, “五个九的正常运行时间” 相当于 99.999% 的正常运行时间—或平均每年停机时间少于六分钟。

 

3.什么是数据中心’停机的影响?

 

第三步也是最后一步是确定 数据中心停机的影响 关于组织。这会给业务带来多大影响?后果是什么?

 

并非所有停机时间都是一样的。例如,对于保险公司或媒体公司来说,停机 15 分钟的影响可能远不及对于医院或制造厂来说停机 15 分钟的影响。

 

大学教师’不要忘记:数据中心类型 & 云端

 

一旦回答了这些问题,那么’就该考虑数据中心风险评估的另外两个因素了: 数据中心的类型 和云环境的存在。这两种考虑因素在确定风险水平或容忍度方面都发挥着作用。

 

例如,为金融机构、医疗保健、IT、制造业、政府和零售业提供服务的多租户或主机托管数据中心的可用性至关重要。客户支付一定程度的冗余费用并确保系统始终可用。计划外停机可能会导致所有客户’ 业务中断。

 

除了您正在使用的数据中心类型’之外,在进行数据中心风险评估时还需要考虑云’。

 

公有云通过互联网上的第三方提供商提供计算服务,并由第三方提供商负责管理和维护。私有云是一种包含服务器、存储、内存和网络容量的内部部署数据中心基础设施。混合云结合了私有云和公共云。每个系统对于停机时间都有自己的要求和容忍度。

 

为潜在事故做好规划

 

新的数据中心风险评估的最后一步是制定业务连续性或灾难恢复计划,以确保在发生灾难时能迅速恢复信息。

 

由于每个 IT 环境都是独一无二的,因此不存在适用于所有数据中心的通用流程,但每个计划都应包括三件事:’

 

  1. 预防措施试图通过识别和降低风险来避免灾难。这些措施包括软件备份计划、不间断电源、发电机以及日常维护和检查。
  2. 侦探措施,要求采取行动消除不必要的事件。这些包括消防和安全系统、防病毒软件、备份软件和员工培训。
  3. 纠正或应对措施,最大限度地减少停机时间或损失。
    1. 灾难恢复即服务 (DRaaS) 是一种地理上分散的镜像解决方案,允许恢复数据,并且能够在主数据中心发生故障或宕机时恢复。它还允许您恢复到某个时间点的数据。
    2. 建立第二个数据中心并被动运行直至需要—或与主数据中心一起主动运行,以便在发生灾难或灾害时进行处理和存储。

 

对于完成下一个项目的数据中心的风险评估,如果您需要帮助,我们的内部专家会在这里提供帮助。

 

要了解有关数据中心风险评估和许多其他数据中心主题的更多信息,请探索我们新的“数据中心基础知识 1 级培训课程”,该课程可作为 Belden Academy 的一部分按需提供。获得三个 CEC,探索数据中心项目的独特特征,并发现从头到尾正确处理数据中心项目的技巧。

 

从这里开始师从我们的数据中心专家学习并获得认证。