1.
概述与项目准备
- 目标:明确可用预算(CAPEX/OPEX)、可接受的可用性等级(如99.95%、99.99%)、以及扩展计划。
- 步骤:(1) 组织跨部门小组(运维、机房工程、电气、制冷、财务);(2) 收集机房平面图、现有负载清单(机架、服务器、网络、存储、UPS等);(3) 计算当前与三年、五年预测功率需求(KW)。
2.
负载与容量评估(详细计算步骤)
- 步骤一:逐设备记录额定功率(W)与实际平均功耗(通过监控或样本测量)。
- 步骤二:按机架汇总峰值与持续平均值,应用因子(容错冗余考虑:例如N+1则乘以(1/(1-冗余比例)))。
- 步骤三:考虑冗余设备与PDU、制冷设备自身功耗,将总IT负载乘以PUE预估值(香港普遍PUE在1.3-1.8间,初期可取1.5作为估算),得出总电力需求。
3.
电力系统设计与实施步骤(UPS、发电机、配电)
- 设计步骤:(1) 确定UPS拓扑(在线双转换为主流,容错等级按SLA决定N、N+1或2N);(2) 计算UPS容量:UPS容量(kVA)>= 最大IT负载(kW) / 总谐波校正因子 / UPS效率;(3) 发电机选型:考虑启动负载、并机需求与燃油保障天数(在香港通常要求72小时备油或与燃料供应合同)。
- 实施操作:(1) 配电方案:主电源 -> ATS -> UPS -> STS/PDU -> 机架;(2) 接地与中性线按IEC标准处理,设置零序保护与电涌保护;(3) 现场测试:空载与满载下切换测试、UPS放电测试并记录运行曲线。具体测试步骤:首先夜间模拟市电掉电,观察UPS切换时间与输出稳定性;随后启动发电机,测试并切换至发电机供电,再恢复市电并记录重切换过程。
4.
冷却方案选择与部署(CRAC/CRAH/行间/液冷)
- 决策流程:(1) 按机房密度选择方案:低到中密度(<8kW/机架)可用CRAC/CRAH配合冷通道/热通道;高密度(>10-20kW/机架)考虑行间冷却或液冷;(2) 在香港受限空间与电费影响,可优先评估间接蒸发冷却与海水/直冷(若机房靠近海岸且法规允许)。
- 部署步骤:(1) 规划冷通道/热通道与挡板、封闭通道;(2) 安装精密空调并接入BMS/监控系统,设置分级控制(冷却台数按照负载分级启动以节能);(3) 验证气流:使用烟棒/风速计测量进出风温差与风速,确认每个机架进风温度在ASHRAE建议范围内(通常18-27°C,可按节能策略提高至24-27°C)。
5.
能效优化与成本控制实操步骤
- 操作清单:(1) 提高冷却设定温度:逐步提升机房供回风差,同时监测服务器热状况;(2) 实施热通道封闭/挡板减少旁路空气;(3) 安装变频驱动(VFD)与EC风机,按负载调速;(4) 引入DCIM/BMS实现能耗可视化并实施按小时PUE计算。
- 成本核算方法:记录CAPEX(设备、安装)与OPEX(电费、燃油、维护),计算回收期:回收期 = 设备投资 / 年节能量(kWh*电价)。示例:若升级EC风机投资10万港币,每年节电5万kWh,电价1.2港币/kWh,则年节省6万港币,回收期约1.7年。
6.
运行维护与应急演练详细步骤
- 日常维护:(1) 每周检查UPS电池室温、外观、报警日志;(2) 每月清洁空调过滤器、检查冷凝水排放与冷媒压力;(3) 每季度进行UPS自检与电池放电测试。
- 应急演练步骤:(1) 制定断电与冷却故障SOP,明确责任人与通讯链路;(2) 每半年模拟市电掉电并启用发电机,记录发电机启动时间、并网切换、负载恢复情况;(3) 每年实施一次完整的“黑启动”演练并复盘改进点。
7.
成本与稳定性的权衡决策流程
- 分析步骤:(1) 列出备选方案及其CAPEX/OPEX与预期可用性;(2) 用风险矩阵量化停机成本(每小时业务损失)与可用性带来的收益;(3) 计算等效年成本(Annualized Cost)并选择ROI最优方案。
- 实务建议:对关键业务采用2N或N+1对策,对非关键业务采用共享冗余以降低成本;结合云混合部署可把高可用性需求外包至高冗余云服务,减少本地CAPEX。
8.
分步实施清单(从设计到上线)
- 详细步骤:(1) 需求确认与预算批准;(2) 方案设计与第三方评估(含电、冷、消防);(3) 设备采购与入场检验;(4) 施工安装(电气、制冷、布线、机柜)并逐项验收;(5) 联合调试:UPS与发电机并机测试、空调与气流验证、监控警报联动;(6) 正式切换上线并在30天内密集监控,记录并优化参数。每步均用验收表并留档。
9.
在香港本地需注意的合规与实操要点
- 要点:(1) 发电机排放与噪音需符合本地环保与噪音管制规定,安装时需申请相应许可证;(2) 燃油储备受用地限制,建议与燃油供应商签长期配送合同或使用并网双来源;(3) 楼宇供电容量申请与地面承重、散热排放需与大厦管理处沟通并获得书面同意。
10.
问答:在香港采用N+1与2N哪种更划算?(问)
- 问:在香港的租金与电费都高的环境下,采用N+1冗余还是2N更划算?
11.
问答:在香港采用N+1与2N哪种更划算?(答)
- 答:如果业务对停机敏感度极高且每小时停机成本远大于增加的CAPEX/运营成本(例如金融交易),建议2N;否则N+1通常以较低的CAPEX/OPEX达到可接受可用性。建议先量化停机成本,再用等效年成本比较。
12.
问答:如何在港降低冷却费用又不牺牲稳定性?(问答合并)
- 问:有哪些实用手段可以在不影响稳定性的前提下降低冷却费用?
- 答:逐步提升供风温度并监控服务器温度、实施热/冷通道封闭、采用VFD或EC风机、分级启停空调、利用夜间外气冷却(经济器)与海风冷却(合规时),并通过DCIM优化服务器负载集中与虚拟化,能在保证稳定性下显著节能。
来源:香港服务器数据中心电力与冷却方案对成本与稳定性的影响