对于数据中心来说,保持业务连续性是首要目标,然而庞大的数据中心面临众多潜在风险,小概率事件也可能带来灾难性后果——机房火灾、服务器长时间宕机、声誉受损,近年来类似故障频频发生:
事件一:韩国SK公司数据中心火灾
2022年10月15日,韩国SK公司C&C板桥数据中心发生火灾,大火在大约8小时后被扑灭。
起火后数据中心断电造成韩国国民级聊天软件Kakao Talk、主流电商平台NAVER等在内的众多网络服务中断。据《韩国时报》报道,本次火灾导致了约3.2万个服务器瘫痪,数千万用户服务受到影响——截止2021年,韩国人口约为5200万。一天之后Kakao Talk等服务才开始陆续恢复。数据中心客户表示,由于损失了大量服务器,恢复过程比预期的要长。
调查发现,安装在地下三层电气设备室的5个电池机架全部烧毁,电池和机架附近似乎因电气因素失火。
事件二:湖南电信荷花园大厦起火
2022年9月16日,位于湖南省长沙市芙蓉区的湖南电信大楼发生火灾,数十层楼体燃烧剧烈,消防赶到后将火势扑灭,撤离及时,无人员伤亡。经初步侦察,现场为大厦外立面起火。为防止发生危险,大楼部分设备断电,据中国电信官方及用户反映,部分用户手机语音和短信功能受到影响,截止当晚12时仍未恢复。
事件三:英国高温致多个数据中心宕机
2022年夏天,欧洲经历极端高温,当地时间7月16日英国气温达到42℃,位于伦敦的谷歌云和甲骨文数据中心均因气温过高出现故障,导致系统宕机。
甲骨文报告,数据中心的两台制冷系统出现故障,导致数据中心内部气温越来越高,一些系统自动采取保护措施关闭作业,使得一些用户的数据使用出现延迟问题。谷歌同样称数据中心内的冷却系统出现故障,导致了该区域的部分容量故障,导致VM(虚拟机)终止和一小部分客户的机器损耗,同时谷歌关闭了机房内的一些机器,以防进一步损坏。
谷歌表示只有“一小部分用户”受到了影响。
炎炎夏日,持续高温
数据中心既要降温以确保设备正常运行,还要兼顾节能降耗使PDE值尽量保持在较低水平。可以有以下方式进行应对:
一、空调优化
选择高效节能的空调设备,并确保其定期维护和清洁。
二、热通道隔离
冷通道和热通道的物理隔离是重要的措施。通过减少不必要的冷空气流失,数据中心可以更有效地降低温度、并降低能耗。
三、高效散热
数据中心的服务器产生大量热量,因此必须采取有效措施进行散热。一种常见的方法是使用热交换器,它可以将热量从服务器传导到冷却液中,然后通过冷却系统将热量散发出去。其他技术包括采用高效的风扇和散热模块,以帮助快速散热并降低服务器的工作温度。
四、温度管理
合理设置数据中心室温范围,不需要过度降温。监控温度变化非常关键,数据中心应该安装温度传感器,并使用监测系统实时跟踪温度。根据环境变化调整冷却设备的参数,如风扇的转速和空调的运行时间,以更有效地管理温度和能源消耗。
五、能源监测
实时追踪数据中心的能耗情况。通过监测,可以及时发现和解决能源异常问题,并采取相应的优化措施。
六、可再生能源
考虑使用可再生能源来供电数据中心,如太阳能光伏板、风力发电等。使用可再生能源可以降低对传统能源的依赖,减少碳排放,并且对环境友好。
七虚拟化技术应用
通过采用虚拟化技术,数据中心可以整合服务器资源,提高服务器利用率,并减少能源消耗。
7*24小时服务专线
021-5106-6258