为加强数据中心基础设施维护,确保数据中心稳定运行,降低数据中心运行成本,提升数据中心PUE值和WUE值,特制订本文运行维护章程。
本文是应广大阅读者要求,数据中心基础设施维护管理工作的基本规章制度,数据中心维护单位和人员应认真执行。各单位可根据工作需要,结合单位的具体情况制定实施细则。
运行维护工作的基本任务如下:
(1)首要目标是实现SLA的要求。
(2)保证基础设施正常运行,设备性能与技术指标、运行环境负荷标准。
(3)检测、分析基础设施运行状况,主动维护,预防事故和故障的方法。
(4)迅速、准确排除设备故障,缩短故障历时。
(5)建立完善可行的用电安全管理制度,并负责实施。
(6)在保证运维质量的前提下,合理控制成本。
(7)优化系统配置,提高设备利用率,充分发挥效能。
(8)做好资源管理,规范管理运维技术资料和原始记录等文档。
(9)积极学习和采用新技术,提升运维技术手段,提高运维工作效率。
运维人员的基本要求如下:
(1)熟练掌握技术知识和操作技能,熟悉设备运行状况,做好运行维护工作。
(2)严格执行维护规程及相关规定。
(3)持证上岗。
编写原则
(1)符合国家相关政策及要求,认真落实国家节能减排要求,建设绿色节能数据中心,强化安全支撑,提高管理水平,促进健康发展。
(2)符合国家和行业标准。包含数据中心设计、建设、验收标准,以及相关设备维护规程。
(3)参考互联网公司数据中心和电信运营商数据中心的企业标准及维护最佳实践经验。
术语
1. 数据中心(Data Center)
数据中心通常是指在一个物理空间内实现信息的集中处理、存储、传输、交换和管理,而计算机设备、服务器设备、网络设备和存储设备等通常被认为是网络核心机房的关键设备。关键设备运行所需要的环境因素,如供电系统、制冷系统、机柜系统、消防系统和监控系统等通常被认为是关键物理基础设施。
2. 主机房(Computer Room)
主要用于电子信息处理、存储、交换和传输设备安装和运行的建筑空间,包括服务器机房、网络机房和存储机房等功能区域。
3. 冗余(Redundancy)
冗余是重复配置系统的一些部件,当系统中某些部件发生故障时,冗余配置的部件介入并承担故障部件的工作,由此减少系统的故障时间。
4. N-基本需求(Base Requirement)
系统满足基本需求,没有冗余。
5. N+X冗余(N+X Redundancy)
系统满足基本需求外,增加了X个单元、X个模块、X个路径或X个系统。任何X个单元、模块或路径的故障或维护不会导致系统运行中断(X=1~N)。
6. 容错(Fault Tolerant)
容错系统是具有两套或两套以上相同配置的系统,在同一时刻,至少有两套系统在工作,每套系统是(N+M,M=0~N)结构。按容错系统配置的场地设备,至少能经受住一次严重的突发设备故障或人为操作失误事件而不影响系统的运行。
7. 全年能效比(Annual Energy Efficiency Ratio,AEER)
机房空调进行全年制冷时从室内除去的热量总和与消耗的电量总和之比
8. 制冷消耗功率(Refrigerating Consumed Power)
在规定的制冷量试验条件下,机房空调所消耗的总功率,单位为W
9. 送风量(Indoor Discharge Air-Flow)
空调器用于室内、室外空气进行交换的通风门和排风门(如果有)完全关闭,并在额定制冷运行条件下,单位时间内向密闭空间、房间或区域送入的风量,单位为m3/h。
10. 热通道/冷通道(Hot Aisle/Cold Aisle)
热通道/冷通道是数据中心的服务器机柜和其他计算设备的布局设计,对于前进风和后出风机柜,相邻两列机柜面对面背对背摆放,两列机柜的进风口通道形成冷通道,出风口通道形成热通道。热通道冷通道构造旨在通过管理气流来节约能源和降低冷却成本。
声明:原创文章,如需转载请联系作者!
领取专属 10元无门槛券
私享最新 技术干货