受AI算力爆发式增长、云计算持续扩张及数字资产集聚化等因素影响,AI数据中心的规模越来越大,同时也面对着越来越严重的散热难题。目前,高密度的服务器架构已超出传统风冷系统的散热能力,而液冷系统通过循环水或冷却液直接接触设备进行散热,具备突出的散热、节能、降噪等优势,已成为AI数据中心高效率散热的主流方案。

值得注意的是,液冷系统在得到规模化推广的同时,相关的管理机制却尚未完善。不同厂商的设备型号多样、接口规范各不相同、人工监管时效性差、运维管理混乱等问题,都增加了管理难度和运维成本,同时也给机房安全运行埋下隐患。因此,构建液冷设备的监控管理系统势在必行。
1、数据中心内液冷设备来自不同厂商,型号各异,需要一个统一的监控平台,能够兼容各种设备的接口和数据格式,实现对所有液冷设备的集中监控,实现信息化管理。
2、液冷系统的运行状态直接影响数据中心的散热效果和设备安全,需要实时采集液冷设备的各项运行数据,如温度、流量、压力等,以便及时发现异常故障与潜在问题。
3、实现可视化处理与数据总览,便于对历史数据进行深度分析,挖掘数据背后的规律,为数据中心的优化升级、设备选型、能效优化等工作等提供决策支持。
数之能以工业物联网云平台为核心,打造软硬件一体化的数据中心液冷设备监控管理系统,通过部署工业智能网关完成液冷设备CDU的数据采集与协议解析,并以5G/4G对接到数之能·工业物联网云平台中,从而搭建可视化数据大屏,实现液冷设备的实时监控、智能告警、远程管控、数据分析、运维管理等全功能落地,为数据中心液冷系统的数字化、智能化管理提供全流程支撑。

1、数据采集
数之能·工业智能网关配备RS485/RS232/以太网口等多种通信接口,可对液冷系统冷量分配单元(CDU)、循环泵、阀门、各类传感器等设备进行数据采集,并实现5G/4G/WiFi/以太网等方式上网。
2、远程监控
通过手机端或电脑端,管理人员能够远程监控各个液冷设备的运行参数,包括冷却液温度、压力、流量,机柜进出口水温,泵体转速/电流,阀门开关状态,冷却液液位及泄漏情况等关键参数。
3、智能告警
系统支持自定义告警规则,从而在监测冷却液泄漏、温度/压力超标、流量异常、设备故障等各类异常情况时自动告警,通过微信、短信、邮件等方式向管理人员推送告警信息,并生成告警统计报表。
4、数据大屏
数之能·工业物联网平台提供丰富的组态控件,支持自定义编辑数据大屏,将液冷设备的运行状态、数据指标等信息以图表、报表等形式直观地展示在监控界面上,方便用户进行监控、管理和操作。
5、运维管理
建立液冷设备可视化电子档案与设备看板,快速查询设备运行状态、告警频率、维保记录等信息,能够实现巡检、保养、维修、备品备件等工单计划的信息化管理,从而实现人员与物力的精准调度,提升设备管理规范化水平。
6、数据分析
实现对各项设备参数的存储、计算与统计,生成设备运行效率、故障分布、冷量利用效率、物料消耗等多类型数据报表与可视化分析图,从机房负载、冷量分配、能耗优化等角度提炼数据价值,制定科学合理决策。


















