数据中心运维,喜冷怕热。在服务器的丛林里,热点无处不在,如何采用安全的RFID新技术方案,从每个服务器真实的物理温度监控开始,准确得出机房的热点云图,是跨越传统技术方案,让运维人员轻松应对日常工作,有效保障用户资产安全的新课题。
一、机房发现热点的方法
当前,大部分数据中心的“热管理”依旧处于被动运维的阶段,即先发现热点,再进行处理,这种思维模式导致的后果有可能是“先热后冷”,稍有不慎,就会酿成大错。
从技术角度看,这个锅不能由IT管理或运维人员来背。当前的技术环境,人员发现机房热点的方式,通常有以下三种方式:
1.在机房内来回观察,用手亲测服务器或机柜的温度。
优点:经济、简单,对温度高的热点辨别最有效;
缺点:准确性差,耗时、耗体力,辐射大。
2.手持温度测量仪实测,检测机柜或服务器温度。
优点:经济、有效,检测温度精度高;
缺点:耗体力,辐射大。
3.自动检测方法,包括DCIM自动监测装置或CFD 软件预测热点。
优点:自动检测,省时省力,能把握机房的整体热点分布;
缺点:软硬件成本大,并且由于颗粒度大,对微观的热点布局把握不准。
二、热点分析的痛点
从数据中心智慧化的运维发展趋势看,自动检测方法将会成为未来热点检测的方向。
但是,目前DCIM通过少数重要检测点的传感器,或者服务器本身的IPMI接口检测温度,还存在问题:
1.如果通过传感器监控稳定,颗粒度会比较大,很多热点无法及时发现;
2.如果采用IPMI接口获取温度的数据,会存在接口安全合规的风险,同时存在部署复杂,仅能监控CPU温度等问题。
三、U位物联结合CFD技术方案
U位物联定位技术是解决服务器定位和数据读取准确率的安全高效的技术方案。数据中心运营者通过业内广泛应用的MC-RFID技术,可以实现了机柜U位资源、容量、位置、状态、信息变更、温湿度的数字化管理,IT管理者通过后端的可视化平台,可以全局掌控U位资产的实时信息。
同时,利用CFD软件6igmaRoom(一款数据中心热环境分析工具),它可以预知整个数据中心范围内、长时间运行中是否会有热点产生,并且从气流组织的角度分析热点产生的原因分析,指导运维人员进行设备部署位置优化、空调制冷能力调整。
上图通过CFD分析得到的热点机柜,通过气流组织确定热点服务器的位置。
6igmaRoom联合U位资产物联系统,可以为用户提供实时准确的资产部署数据——IT设备部署信息可以实时同步,无需人工录入,U位资产读取数据100%准确,机柜内的温湿度实时检测并得出报表数据。
该方案机柜内热点检测的方法是,通过机柜内的智能控制模块,实时检测服务器及周边的温度,当服务器发生位置变更时,U位物联系统会及时更新信息,并重新检测机柜内的温度信息。然后,6igmaRoom会利用最新的数据进行实时的模型分析,从而预知可能产生的热点,帮助运维人员提前发现风险,及时预防。
四、运维成本下降是趋势
Gartner公开的资料显示,数据中心资产运维管理的成本构成主要分为三部分:
流程维护成本:包括日常维护、变更管理、测试成本等;
运维人员成本:包括招聘、培训、教育、人员流失成本等;
技术和产品成本:包括硬件、软件、网络成本等。
其中,人员成本支出接近运营支出的一半。因此,如何通过技术和产品创新,实现机器替代人类多承担工作,减少人为失误导致的损失,已经成为数据中心运营节省成本支出的重要方法。
U位物联系统与CFD实时仿真系统的结合,是解决数据中心运维人员短缺和成本居高不下的有效实践,对数据中心自动化热管理能力的提升,降低运维的复杂度有非常大的现实意义。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。
原创声明:本文系作者授权腾讯云开发者社区发表,未经许可,不得转载。
如有侵权,请联系 cloudcommunity@tencent.com 删除。