
一、AI光模块功耗挑战与低功耗技术探索

在AI领域迅猛发展的当下,光模块的需求呈现出指数级增长态势。然而,功耗问题却成为了亟待攻克的关键难题。在传统的可插拔光模块中,DSP模块,其中包含重定时器、均衡器等功能,大约占据了模块整体功耗的40%。为了应对这一挑战,业界积极投身于低功耗可插拔光模块技术的研究,主要聚焦于LPO(线性驱动光模块)、LRO(线性接收光模块)以及适配浸没式冷却的光模块方案。

二、LPO与LRO技术详解

(一)技术原理

- LPO(Linear Pluggable Optics):该技术将DSP功能从光模块转移至ASIC芯片,移除了模块内的重定时和均衡功能。这一举措不仅显著降低了功耗,还减少了组件成本,同时降低了链路延迟,提升了系统的可靠性。

- LRO(Linear Receive Optics):采用了混合架构,在发送端(Tx)保留重定时功能,接收端(Rx)则采用线性设计,以此来平衡功耗与性能。
(二)性能表现
1. 误码率(BER)测试

- 800G DR8光模块:基于64端口交换机进行测试,结果显示误码率低于3.1e-8,平均误码率为1.92e-10,这表明线性光模块在性能方面表现十分优异。

- 800G FR4光模块:针对短、中、长距离通道进行了测试,均展现出良好的误码率数据,平均BER为4.13e-10。
2. 功耗对比

通过实际测试发现,LPO(DR8)的功耗为9 pJ/bit,LRO(DR8)的功耗为11.3 pJ/bit,而传统DSP模块的功耗约为18 pJ/bit,相比之下,LPO功耗降低了约50%。
3. 系统级功耗优化

交换机的实测数据表明,在相同的风扇转速(50%、75%、100%)条件下,LPO模块相较于传统DSP模块,可使交换机的整体功耗降低约25%,并且模块温度降低约15°C,这显著提升了散热效率。Macom和Arista之前的报告也显示,移除DSP后,模块因工作温度降低,可靠性得到了显著提升,交换机级功耗可降低40%。


三、液冷光模块方案

(一)技术优势

- 能效提升:双相浸没式冷却相较于空气冷却,能够显著降低数据中心的PUE。光模块直接浸没于冷却液中,通过液体相变进行散热,进一步优化了系统级能效。
- 灵活性设计:采用MPO连接器接口,而非传统的尾纤方案。利用光学连接器的物理接触设计,如弹簧力密封,防止液体渗入。这种设计允许用户根据自身需求选择不同长度的跳线,简化了供应链管理,因为物料清单(BOM)仅需光模块和通用跳线。
(二)实测验证

- OFC 2025演示:基于Celestica DS 5000交换机搭建了浸没式测试平台,通过环回菊花链模拟网络负载。含DSP的光模块在50°C冷却液中运行时,可以看到沸腾气泡。采用MPO接口的可插拔模块实现了稳定的链路连接,表明链路可靠性优异。



(三)应用挑战与展望

目前,浸没式光模块的插拔操作仍建议在非浸没环境下进行,例如水箱外或隔离区域,以避免液体渗入光学路径。未来,需要进一步研究不同冷却液特性,如颗粒大小,对连接器密封性的影响,并探索标准化的插拔流程。
四、总结
- LPO/LRO技术:通过移除DSP功能,在功耗、延迟、成本和可靠性等方面实现了多重优化,非常适用于AI机器学习的低功耗需求。
- 液冷光模块:通过硬件设计创新,如MPO接口,与散热方案相结合,为数据中心能效提升提供了新的途径。未来,需要通过行业协同测试,如OCP标准适配,来验证其在多系统中的兼容性。