当前数据中心内部的IT环境通常很复杂,服务器、网络、存储等设备数量众多、管理接口各异。而IT设备作为数据中心基础设施管理的上层管理对象,如果没有统一的连接方式、缺少集中化的控制能力,那么在设备种类众多,且部署分散在数据中心各个机房的情况下,一旦设备出现故障,由于缺少Bios级别的连接能力或管理通道,维护人员需要花费大量时间进入机房内对设备进行紧急的故障处理或维护,这将明显延长了故障恢复时间,给数据中心业务的不间断运行带来了很大的隐患。此外未充分利用的IT设备也是引起数据中心能耗过度消耗的一个极大因素。
因此,在DCIM解决方案中,实现可靠的IT设备连接能力,可以为数据中心的IT设备提供跨平台、跨系统的统一管理入口,将基础设施管理真正意义上扩展至IT层面,保证数据中心的物理安全性及IT服务器可用性。另外,在DCIM解决方案中实现服务器的集中能耗监测及能耗控制能力,可以带来显著的管理成本降低和能耗成本减少。因此,DCIM解决方案所提供的IT的控制能力将成为未来数据中心基础设施管理中不可或缺的手段从技术的角度,数据中心的IT设备连接管理可分为带内管理(in-band)和带外管理(out-of-band)两种管理模式。
所谓带内管理,是指网络的管理控制信息与用户网络的承载业务信息通过同一个逻辑信道传送;而在带外管理模式中,网络的管理控制信息与用户网络的承载业务信息在不同的逻辑信道传送。
集中、易用、安全的IT设备带外连接及管理能力是一个全面DCIM系统所应该具备的。对IT设备访问及管理应基于以下应用原则:
1、能耗实时监测
如果精细化到每一个电源端口的的功耗监测,可以使用的机柜智能PDU进行功耗的读取,也可以通过IPMI协议通过服务器BMC来直接做到对于服务器级别功耗实时监测。
2、实现带内管理的整合,带来统一管理入口
为了实现IT设备的统一管理,带内与带外管理相结合的方式无疑是DCIM管理系统更好的IT设备管理方式。在带外管理的基础之上,DCIM管理软件实现提供通过RDP, SSH, VNC等会话连接服务器、网络及存储设备,进行远程集中控制管理,将实现直接对数据中心所有IT设备进行有效管理和配置;这将大大降低了管理成本,提升了运维水平。
DCIM平台还可以和KVM、SP以及串口管理等数据中心远程管控的平台相集成。比如,当DCIM平台监测到某台服务器存在异常,可以直接在DCIM平台打开KVM的session,从而对该服务器进行操作。这样会大幅减少人员在不同平台之间切换,以及设备定位的时间,进一步提高人员和流程的效率。
3、能耗监测与分析
在一个投入运行的数据中心总会有一些服务器一直在开启状态,很长时间都没有任何业务负载,一直在消耗电力和制冷。利用服务器能耗分析,可以很容易的确定长期低负载服务器的信息,从而将这些服务器更加合理有效地加以利用。并且基于IPMI协议所实现的群组级别自动开关机能力,可以将没有业务的部分服务器一次性统一关机节省电能,并而在业务来临时再迅速开启投入运营,这样可以在不影响业务性能的情况下,最大限度的降低了能耗水平,节省了能耗成本。
4、监测IT设备能耗,合理增加机柜密度
目前,数据中心内针对服务器上架到机柜,一般来说都是利用经验功率或者服务器铭牌功率为标准进行服务器的上架。假设一个42U的机柜额定电流为20A,如果预估2U服务器的经验功率为350瓦,则最多只能放置12个服务器,宝贵的U位空间资源被明显地浪费了。当DCIM软件可以监测并记录服务器的实时功耗,在监测一段时间后,发现每台服务器的功耗从来没有超过300瓦甚至更低,那么结合服务器功耗控制,数据中心管理者就可以安全、有依据、可靠地利用DCIM软件的实际分析结果来提高机柜的服务器部署密度,合理的进行能源和空间资源的优化,从而延长数据中心的使用寿命。
IT 管理人员和设施管理人员应当全面的考虑如果物理基础设施故障或者不可用,其对业务连续性所可能产生的影响。这就意味着应该重新考虑和审视IT 管理系统和制度以确保它们在降低物理基础设施冗余的情况下,有能力提供所需的服务等级和容错能力。物理基础设施的冗余性与虚拟 IT 环境的容错性相匹配,也是正确规划选型的一种方式。这种方式的正确规划选型能够进一步减少能耗,投资成本和固定损耗,从而改善数据中心基础设施效率PUE。