众所周知,数据中心所有营运负载几乎都是通过UPS电源来供电的,确保UPS以最安全的模式运行,是数据中心机房供电系统安全的核心。因此,积极引入先进的设计理念和业界成熟的电源设计技术,对数据中心UPS供电系统进行系统化的安全设计,提高数据中心机房UPS供电系统可用性显得至关重要。
何谓可用性?从学术上的可用性定义看,可用性指产品在任一随机时刻需要开始和执行时,处于可工作或可使用状态的程度。
在行业里,通常用“多少个 9”来代表系统可用性的高低。它是指一年内,系统在线运行及可进行生产的时间比例。系统可用性为 4 个“9” ,是指可用性达到 99.99%,即每年系统可能存在的宕机时间少于 53 分钟。5 个“9”(可用性可达到 99.999%),即每年可能存在的宕机时间少于 5.3 分钟。6个 “9”(可用性可达到 99.9999%),即每年可能存在的宕机时间少于 32 秒。UPS系统的目标是尽量提高 UPS 电源系统的可用性,减少来自市电的影响。
而对于使用UPS的用户而言,可用性就是指UPS好不好用、易不易用、从生命周期看是否使用成本够低。这一点,我们可以从回顾UPS的发展历程得出。
从UPS的发展历史看,可用性已成为UPS发展的驱动力
最古老的UPS是动态UPS,其利用机械储能以及发电机、电动机的能量传输机制以提供不间断电源,体积庞大、造价昂贵、噪声巨大,俨然一个小型电厂。使用起来占用大量场地资源,既不环保,又不易使用,更接近一个工程而不是设备。
工频机作为下一代UPS减小了体积,但仍然在安装、运输中存在巨大问题。因为庞大的体积导致无法通过门,内置的隔离变压器导致重量太重,无法使用电梯运输,安装此类UPS经常要打墙安装、吊车运输。同时,其维护也非常困难,如此庞大的机器,任何一个部件出错,都要转到维护旁路进行维护,这样造成业务中断的风险大增,成为供电基础设施的可用性短板。
高频机的出现进一步提升了功率密度,体积减小了50%,从功能模块上提升了维护性,缩短了MTTR时间,可在数小时内完成修复。重量较工频机进一步降低,有效提升了工程的可安装性。同时,高频机也大都采用了类模块化设计,在维护性方面也有较大改进。THDi可以做到5%以下,明显减少电网的谐波污染,效率也进一步提升到92-94%,体现出其节能优势。即使这样,也做不到类似直流供电系统的在线扩容、在线维护等特性。
模块化UPS的出现,大大提升了维护时间,可以在线扩容、在线维护。在安装、运输、维护等使用方面均已不再是供电系统可用性的短板。THDi在5%以内,效率进一步提升达96%以上。最新一代的华华为模块化UPS,功率密度可以做到单柜320kW,一个模块40 kW /3U,使得原来需要2个机柜时,目前只需1个机柜。这是一个重大突破,减少设备占地面积,同时考虑到靠墙放置,减少维护占地面积,客户实际使用的空间减少了近70%!这在当前寸土寸金的时代,无疑是巨大的商业价值。
可靠性合理设计是UPS可用性的基石
业界对可靠性的定义为:产品在规定条件下和规定时间内完成预定功能的概率。
华为UPS5000-E系统,采用Markov模型可靠性建模方法,采用串联、并联、S中取T等基本结构的Markov模型求解,获得由并联的失效率和等效修复率。从系统最低层次的单元开始逐级往上,计算出一级串联、并联、S中取T模块的等效失效率和等效修复率,重复这一过程直至获得整个系统的等效失效率和等效修复率,最后得到系统的MTBF、可用度和宕机时间等可靠性指标。
对于FIT(失效率)值极低的部件可不设冗余,对于较易损坏或需经常维修、维护的部件采取多重冗余,如AC-DC\DC-AC,做到精细化可靠性分配,达到最佳的可靠性投资分配。通过计算,华为UPS5000-E单机系统,MTBF可达263821小时,可用性更高达99.9999%。大幅高出业界平均水平。
可维护性是UPS可用性的生命线
据统计,多数UPS设备供应商,每年需要完全下电一次进行预防性维护,根据系统配置的不同,该维护一般每年需要 1 到 4 小时的计划停机。系统设计必须允许同时维护电源系统的所有组件(包括 UPS 和配电设备),一部分 UPS 维修时,可使用其余的 UPS 系统向负载供电。显而易见,这时就需要多总线的解决方案。然而事实未必如此,很多用户业务也不允许这样维护。而解决方案也很简单,正如上文阐述,需要从可靠性分配模型进行分析其可维护性,这也是UPS的可用性的生命线。你会发现主要需要维护的部分是功率模块部分及控制模块部分,而这些部件华为UPS5000-E均提供热插拔功能(现场维护时间小于2min),可进行在线维护,守住了UPS系统维护性的生命线。
易用性是UPS可用性的升华
实际UPS的使用过程中,99%以上的时间是不需要维护人员参与的。需要人为参与的时候,除了上述的维护时间以外就是扩容、安装、巡检维护等情况,这些时候最能体现UPS是否好用、易用。
先说扩容,通常UPS塔式机型的扩容。其可操作性的难度是显而易见的。由于塔式UPS的输入输出连接是固定的,自成一体,如若更换升级则需要端到端的改变。需要增加UPS输入、输出路数、更换电缆规格、重新布置UPS摆放空间……等于重新开展一个UPS安装工程,难度还高于全新的安装。花费时间至少在48小时以上。
而华为UPS5000-E的扩容则不然,只要选择了充足容量的柜体,一旦需要扩容,则只需立在几分钟内完成了扩容,这便是UPS好用与否的直接体现。
易用与否还体现在运输和搬运过程中。塔式机型往往体积大,重量达几吨,不易运输和搬运,经常会在运输过程造成损坏,而这种损坏有些可以目测,有些需要上电才能发现,甚至上电运行一段时间才能发现。发现问题后,需停机维修或更换,费时费力。华为UPS5000-E则采用标准的IT机柜,模块化设计,可拔出模块运输,也可一体化运输和搬运,大大避免了上述的风险。这又是UPS好用的一个体现。
另外,在安装过程中也能体现出UPS的好用与易用。在实际安装现场,体积大、重量达几吨,无法进电梯,只得通过打墙、吊车出动,方才可以完成这样的安装工程。能否将UPS化整为零,从“门”进入安装现场呢?可以。华为UPS5000-E按照标准机柜设计,完全可以 “自由进出”电梯或机房的门,简易灵活。
最后,当UPS投入正常使用后,用户需要接触UPS的时候就是例行巡检。那么怎样的巡检的人机界面是友好的、方便的、节约的呢?首先,机器要占地面积小,空间越大越浪费资源。在当今地租昂贵的年代,一个机架一年的出租费用就在6-7万元,如果再加上维护空间,就要乘以3倍。这就体现在UPS的功率密度上。而华为UPS5000-E是功率密度高的机型。40kW/3U,大大节约占地空间。其次,能否前维护?如果维护UPS还需要前后维护,那么就直接提高了维护时间和难度,增加维护期间的断电风险。同时还要看是否可以靠墙安装。靠墙安装可以节省维护空间。华为UPS5000-E就是秉承上述理念,完全前维护、支持靠墙安装。
结束语:
随着大数据时代爆发式的发展,供电系统的可用性日益重要,华为高可用性UPS顺应了时代需求,为供电系统的安全可用保驾护航.