首页
学习
活动
专区
圈层
工具
发布
社区首页 >专栏 >DesignCon 2025:字节跳动的1.6T DR8硅光LPO模块设计和性能评估

DesignCon 2025:字节跳动的1.6T DR8硅光LPO模块设计和性能评估

作者头像
光芯
发布2025-04-08 21:29:27
发布2025-04-08 21:29:27
1.6K0
举报
文章被收录于专栏:光芯前沿光芯前沿

DesignCon2025会议上,字节和羲禾一起分表了基于硅光子调制器的单波224Gbps的1.6Tbps LPO 系统的设计与性能评估工作。 一、800Gbps LPO 系统的性能验证 在正式踏入 1.6Tbps LPO 系统的探索之旅前,研究人员先对 800Gbps LPO 系统进行了广泛测试。结果显示,基于硅光子调制器方案的 LPO 性能表现卓越,并已在小批量生产中得到验证。具体而言,研究人员将来自三家不同模块制造商的 64 个 800Gbps LPO 模块样本随机插入交换机的 64 个端口中,进行端到端的比特误码率(BER)测试。测试数据表明,这三家制造商的 64 个模块在交换机上的 BER 均能达到 1E-9 的标准。

此外,从每家制造商中随机抽取 20 多个模块插入交换机端口进行长期流量测试,在 45°C 的环境温度下,对链路的前向纠错(FEC)错误分布进行为期 15 天的监测,结果显示所有模块的 FEC 错误分布均在 3 以内。

从 800Gbps LPO 模块的角度来看,模块制造商的小批量生产数据显示,在三个温度点下,OMA、ER、TDECQ 和 CEQ 均能满足 112Gbps LPO MSA 定义的 TP2 规范,从而确保不同制造商的 LPO 模块之间实现互联互通。目前,正在进行小批量(数百个规模)的 800Gbps LPO 模块部署,用于网络验证,运行状态稳定。

对于1.6T LPO模块,成本相比DSP模块可以节省20%,功耗降低68%(>30W vs <10W)

二、1.6Tbps LPO 系统的理论分析 (一)调制器啁啾 对于 IMDD 系统中的硅光子集成芯片(SiP PIC),实现 Mach-Zehnder 调制器(MZM)的零啁啾调制至关重要。理论上,MZM 可以实现几乎零啁啾调制,但要实现这一点,需要保证光学和电学的平衡,包括消光比、驱动电压和 Vpi 的平衡。

(二)光多径干扰

光多径干扰(MPI)是 IMDD 光通信系统中常见的现象,通常会带来较大的性能损失。当光链路中存在多个反射点时,调制光信号和光载波会以由任意两个反射点之间的往返长度确定的延迟到达接收端。MPI 会导致信号的幅度和相位发生变化,从而影响信号质量。例如,当延迟足够大时,延迟的调制光信号无法通过 FFE 滤波器消除,会作为残余的码间干扰(ISI)降低 BER 性能。此外,MPI 还会将发射机连续波(CW)激光的相位噪声转换为强度噪声,主要在低频区域增强发射机激光的相对强度噪声(RIN),增加的激光诱导噪声可以通过某些 DSP 算法部分消除,但这会带来更高的功耗。

(三)MZM 带宽 码间干扰(ISI)是由通信系统中每个组件的非理想级联频率响应引起的。尽管可以通过 CTLE、FFE 和 DFE 等技术来消除 ISI,但这些技术各有局限性。例如,FFE 的一个主要缺点是由于信号和噪声在频域分布不同,会导致过强的均衡器增强噪声。因此,由于幅度响应高频区域的严重滚降引入的 ISI 无法完全消除,因为 FFE 需要在 ISI 和均衡器增强噪声之间找到最佳平衡。MZM 的 S21 是系统带宽优化的重要部分。 (四)MZM 非线性 硅波导中输入光功率较高会产生双光子吸收(TPA)。所以硅调制器前面的无源光学器件由耐高功率的SiN来加工。对于理想的 MZM,其光电转换函数是一个正弦函数,在小信号近似下可以视为线性。然而,为了保证足够的接收灵敏度和消光比(例如>4dB),小信号近似不再适用。此外,当输出摆幅较高时,电放大器的非线性通常非常关键。通常,调制器Driver的非线性比 TIA 更显著,因为调制器Driver需要比 TIA 更大的输出摆幅以确保发射机的消光比和 OMA

三、基于 224Gbps/lane 硅光调制器的 LPO 系统仿真 (一)仿真模型介绍

在 LPO 系统仿真中,研究人员主要关注具有较大射频损耗或不同参数配置可能显著影响系统性能的组件。与 224Gbps 接收机(Rx)相比,224Gbps 发射机(Tx)面临更多挑战,因此仿真主要集中在 LPO Tx 链路,包括硅光子 MZM。Tx 通道包括交换机封装、交换机 PCB 走线、OSFP 连接器和 LPO 模块 PCB 走线,默认总 Tx 通道损耗约为 23dB。 研究人员使用 ADS 软件构建了 LPO Tx 链路仿真模型。在交换机侧,224G Tx Serdes 由 IBIS-AMI 模型描述,封装由 S 参数描述。交换机 PCB 走线由微带传输线(TLines)ADS 模型描述,其射频损耗可根据不同走线长度设置从 3dB 变为 12dB,默认射频损耗(长走线)在 56GHz 时为 9dB。OSFP 连接器由测试的 S 参数描述,在 56GHz 时典型射频损耗为 1.6dB。此外,连接器在>40GHz 的频率范围内会引起显著反射(>-10 dB),这将导致 LPO 性能下降,需要在未来进一步优化。

在 LPO 模块侧,PCB 走线由 S 参数描述,在 56GHz 时典型射频损耗为 2.5dB。线性驱动器也由 S 参数描述,模型中驱动器峰值可设置为低或高。硅光子 MZM 由模拟的 S 参数描述,默认 3dB 光电带宽设置为 45GHz,这是在高反向耗尽电压 Vpn 为-3.5V 下实现的,导致 Vpi 为 8-9V。在 Vpn 为-1.5V 下,带宽仅为 37GHz,Vpi 为 6-7V。 (二)不同 PCB 走线损耗下的系统性能仿真 首先研究了在交换机 PCB 走线损耗为 9dB 和 12dB 时,系统的损耗上限。当交换机 PCB 走线损耗为 9dB 时,Tx 链路的 6dB 带宽超过 50GHz,理论上适用于 200G/lane LPO。但 S 参数存在较大波动,这是由链路中的反射引起的。当交换机 PCB 走线损耗为 12dB 时,总损耗约为 26dB,S 参数和眼图都非常差,理论上 LPO 不可行。

对于较短的交换机 PCB 走线,射频损耗可能在 56GHz 时为 6dB 和 3dB。在高驱动器峰值下,这两个 Tx 链路的 3dB 带宽均超过 50GHz,这意味着可以考虑较低的驱动器峰值。 四、基于 1.6Tbps LPO 模块的测试与结果分析 (一)1.6Tbps LPO 模块测试评估

测试逻辑图和实际测试环境如下:研究人员采用了一个 MCB 板,其固定走线损耗约为 6dB,集成了一个主流Retimer芯片,封装损耗约为 2dB,连接器损耗约为 2dB,总计约 10dB 走线损耗模型。测试还包括 2 个 1.6Tbps LPO 模块、1 个可调光衰减器、1 个光学采样示波器、2 根 500m 光纤等材料,用于评估 1.6Tbps LPO 模块的性能。 评估指标包括 BER 和 TP2 光眼图。实验设置了四个部分: • 实验 1:通过调整可调衰减器的衰减值,评估 1.6Tbps LPO 模块在短光纤不同光功率下的 BER。 • 实验 2:通过调整 PIC 的反偏电压,评估 PIC 带宽对链路 BER 性能的影响。 • 实验 3:通过调整驱动器峰值,评估Driver Peaking对链路 BER 性能的影响。 • 实验 4:采用光学采样示波器观察 1.6Tbps LPO 模块在最佳链路 BER 条件下的 TP2 眼图,以及在最佳 TP2 眼图下的链路 BER。

从实验 1 的结果来看,在 5m 短光纤连接场景下,OMA 光功率在-0.16 到 2.84 dBm 范围内,不同通道在三个温度点(70°C、40°C 和 0°C)的 BER 约为 1e-9。在 500m 长光纤连接场景下,BER 恶化了 0.5 到 1 个数量级,OMA 光功率在-0.16 到 2.84 dBm 范围内,三个温度点的 BER 小于 1e-7。

实验 2 的结果显示,当 PIC 带宽超过 45GHz 时,BER 范围为 1e-9 到 5e-10。然而,当带宽降至 40GHz 以下时,BER 显著恶化。因此,为了保证 1.6Tbps LPO 链路性能,PIC 的带宽应高于 45GHz。

实验 3 的结果表明,当Driver Peaking为最小 0dB 时,BER 约为 1e-9,表明链路裕度足够。当Driver Peaking为最大 5dB 时,BER 大于 1e-7,表明性能较差。基于通道插入损耗,当驱动器峰值设置在适当值时,1.6Tbps LPO 模块可以实现相对较好的 BER。

在实验 4 中,当链路 BER 最佳为 1e-9 时,TP2 的光眼图如图 4.5 所示,消光比(ER)为 4.162dB,相对较好。然而,TDECQ 为 4.03dB,表明光链路成本相对较高。

如图 4.6 所示,当 TP2 眼图最佳时,ER 为 3.719dB,TDECQ 为 3.3dB,此时 BER 为 1e-7。从对比数据可以看出,链路 BER 和 TP2 指标之间没有直接联系。因此,在实际生产和应用中,必须平衡 TP2 眼图指标和 BER 性能,以实现相对较好的链路 BER,同时确保光路性能。 (二)TP2a 波形分析 研究人员使用离线 DSP 对 TP2a 测量的波形进行了分析,该 DSP 的复杂度限制远低于实际商业 DSP,旨在找出 Tx 系统中的损伤源。分析框图如图 4.7 所示,FFE 均衡器有 127 个抽头,非线性均衡器是一个具有 15 个二阶抽头和 15 个三阶抽头的 Volterra 均衡器。

分析结果显示,波形没有显著包络,表明光链路中没有强 MPI。计算的 Tx 幅度频率响应如图 4.8(b)所示,从 40GHz 到 60GHz 的高频区域存在一些较大的波动。这些波动很可能是 Tx RF 链路上的电反射引起的。如果 Rx DSP 中的浮动抽头无法消除这些反射,BER 将会恶化。

经过 FFE 均衡器处理后,信号信噪比(SNR)从 20.80dB 增加到 23.64dB,主要在 40GHz 到 56GHz 的高频区域。然后,信号被馈入非线性 Volterra 均衡器,SNR 进一步增加到 25.20dB。通过比较 FFE 均衡化和非线性均衡化后的噪声,可以看出非线性引入的噪声主要在 25GHz 到 56GHz 的频率区域,表现出强烈的频率依赖性。经过线性和非线性均衡化后的剩余噪声仍然表现出频率依赖性,这可能是高带宽电路中放大的热噪声。这种噪声在频域中应该是平坦的,但被 FFE 均衡器增强。因此,高频区域增强的幅度在某种程度上表明了 Tx 带宽的限制。

分析结果表明,在没有电反射和非线性限制的情况下,PAM4 信号的 Tx SNR 可以达到 25.20dB。在 AWGN 条件下,这样的 SNR 应该能够实现约 1e-16 的 BER,比测量的环回 BER 低 7 个数量级。然而,这一结果是通过采样示波器实现的,其在模拟硬件方面几乎没有功率和成本限制,能够实现比实际 224Gbps LPO 模块 Rx 更好的性能。如果能够缓解这两个 Tx 损伤,有望实现 2 到 3 个数量级更低的 BER,但同时也需要仔细权衡更高的成本和功耗。 五、结论 本文对基于 224Gbps/lane 硅光调制器的 1.6Tbps LPO 系统进行了深入研究。通过理论分析、系统仿真和实际测试,全面评估了其可行性。研究表明,在 800Gbps 速率下,LPO 模块具有卓越的性能和显著的功耗优势,为后续 1.6Tbps LPO 系统的研究奠定了坚实基础。当速率提升至 1.6Tbps 时,基于 224Gbps 硅光调制器的 LPO 系统面临诸多挑战,如调制器啁啾、光多径干扰、带宽和非线性等。测试和分析发现,合理设置光子集成电路(PIC)的带宽(高于 45GHz)和优化Driver Peaking有助于提升系统性能。然而,在实际生产和应用中,必须仔细平衡 TP2 眼图和链路 BER。未来的工作将重点优化 224Gbps 硅光调制器的设计,以进一步提升系统性能,更好地满足线性系统的需求。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-02-17,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 光芯 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
0 条评论
热度
最新
推荐阅读
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档