Loading [MathJax]/jax/output/CommonHTML/config.js
前往小程序,Get更优阅读体验!
立即前往
首页
学习
活动
专区
圈层
工具
发布
首页
学习
活动
专区
圈层
工具
MCP广场
社区首页 >专栏 >OFC 2025 TeraHop报告:AI数据中心光连接技术

OFC 2025 TeraHop报告:AI数据中心光连接技术

作者头像
光芯
修改于 2025-04-27 06:25:15
修改于 2025-04-27 06:25:15
3610
举报
文章被收录于专栏:光芯前沿光芯前沿

人工智能技术快速发展的背景下,AI数据中心的建设对光模块技术提出了更高要求。TeraHop在OFC 2025会议上的报告,深入探讨了这一领域的现状与未来。

一、AI数据中心光互连面临的挑战

(一)传输速率升级加速

过去光模块技术更新换代周期约为4 - 5年,如今已大幅缩短至2 - 3年 。目前,800G光模块已实现大批量出货,1.6T光模块今年开始逐步放量,预计明年达到出货峰值,3.2T光模块也将在2028年左右推出。如此快速的迭代节奏,对光模块厂商的研发能力和技术储备形成巨大考验。

(二)数据中心规模扩张带来的新难题

当下,数据中心规模不断增大,出现多兆瓦级别的大型数据中心,单一建筑已难以满足需求,需在多栋建筑内构建庞大集群。这不仅增加了光传输的距离要求,也使得能耗问题愈发突出。正如谷歌所指出的,每瓦性能已成为衡量数据中心的重要指标,如何在提升GPU性能的同时最大化功耗利用率,成为关键问题。

此外,数据中心内光纤数量需求剧增,部分超大型数据中心甚至需要部署数百万根光纤,光纤管理难度大幅上升,传统光纤方案已难以满足需求。

(三)技术演进中的可靠性与兼容性挑战

随着光模块技术向更高速率、更复杂架构发展,系统信号完整性问题凸显。从ASIC芯片到可插拔连接器的信号链中,任何环节的损耗都可能影响整体性能。同时,新技术如CPO(共封装光学)虽然能显著降低功耗,但在集成复杂度、设备维修和可靠性方面仍存在诸多难题,且由于实际部署案例较少,推广难度较大。

二、TeraHop提出的技术解决方案

(一)硅光子技术成为关键支撑

硅光子技术是推动数据中心规模扩展的核心要素。在过去几年,TeraHop持续推进基于硅光子的光模块生产,21Q1到24Q4累计的Device Hours达100亿。实际数据显示,硅光子芯片的故障率(FIT)低至0.1,具备高可靠性,为数据中心的稳定运行提供了保障。

(去年OCP 2024的报告,OCP 2024旭创报告:硅光LPO、可安装(mountable)的CPO,TeraHop给的截止24Q2的数据还是30亿小时,FIT<0.4;以前Intel经常拿出来说的基于800万激光器异质集成的硅光器件的FIT同样也是<0.1)

(二)相干光技术的数据中心内部应用探索

传统用于长距离传输和数据中心互联DCI的相干光解决方案,正被尝试应用于数据中心内部。TeraHop研发的800G LR2解决方案,采用2个O波段DFB激光器+硅光PIC(无可调激光器),可实现无光放的20 - 30公里传输距离,延迟仅500ns,在本次会议上进行了相关技术演示。同时,OIF和IEEE等组织也在制定标准,以优化相干光技术在数据中心连接中的性能。

(三)低功耗线性光学技术的发展

1. 全重定时收发器优化

针对全重定时(Fully Retimed)收发器,TeraHop通过降低DSP芯片功耗、改进光学组件等方式,将1.6T光模块的功耗降低至24W左右,未来有望通过下一代DSP技术进一步降至20W以下。

2. RTLR(LRO)技术突破

RTLR(Retimed Transmitter, Linear Receiver)技术仅在发射端使用DSP,相比全重定时方案可降低至少40%的功耗,旭创展示的第一代1.6T RTLR光模块已展现出良好性能。

3. LPO和CPO的探索与挑战

全线性光学技术(LPO和CPO)虽能节省约60%的功耗,但面临信号链容差要求高、互操作性差、集成复杂度高和维修困难等挑战。尤其是CPO技术,由于实际部署经验不足,其可靠性还需进一步验证。

(四)多通道与高密度光模块

为满足更高带宽需求,OIF成立了能效接口工作组,启动32 - 128通道光接口项目。以32通道、每通道200G为例,可实现6.4Tbps的传输速率;若每通道提升至400G,速率将翻倍。可插拔光模块在集成更多光学器件方面具备潜力,结合硅光子技术,有望实现更高密度和带宽(Z mount 接口的光模块)。

(五) 单通道400G技术

在3.2T光模块的研发进程中,单通道400G技术成为重要突破口。旭创展示了将400G光模块与DSP集成的原型产品,这一成果在PAM4调制模式下展现出良好性能。

然而,单通道400G技术面临系统信号完整性的巨大挑战,从ASIC到光模块的信号传输路径中,信号损耗极易导致性能下降。其中共封装铜缆(Co - Packaged Copper Cable)技术,通过优化信号传输路径,显著降低从ASIC到可插拔面板的信号损耗,提升整体传输质量。

(六)光交换与光纤技术创新

1. 光交换(OCS)

TeraHop通过硅光子技术实现光交换功能,可降低功耗、减少延迟,提升AI集群的可用性和可靠性。尽管目前处于概念验证阶段,但硅光子平台在可扩展性和成本效益方面具有显著优势。

(TeraHop的硅光OCS是与美国nEye公司合作的,nEye是美国UCB大学孵化的初创公司,主要走多层硅光波导MEMS路线,采用Crossbar架构,是目前能够实现大端口数片上OCS的解决方案之一,切换时间在us量级,最大支持500端口,能耗低但需要高压Driver,nEye在OFC之后也宣布完成了5800万美元的B轮融资)

2. 多芯光纤应用

针对光纤管理难题,TeraHop展示了多芯光纤光模块方案,可将光纤数量减少至少四分之一,降低部署复杂度。同时,多芯光纤在应对下一代400G每通道传输时,可有效解决传统CWDM技术的色散问题,实现2 - 3公里的无损耗传输 。

三、未来发展方向

TeraHop认为,未来将继续依托可插拔光模块的成熟技术,逐步实现从1.6T到3.2T,乃至更高的6.4T及以上速率的跨越。OCS技术与可插拔光模块相结合,将成为支持数据中心规模扩展的重要手段。在技术演进过程中,不断攻克现有难题,提升光模块的性能、可靠性和兼容性,以满足AI数据中心日益增长的需求。

本文参与 腾讯云自媒体同步曝光计划,分享自微信公众号。
原始发表:2025-04-21,如有侵权请联系 cloudcommunity@tencent.com 删除

本文分享自 光芯 微信公众号,前往查看

如有侵权,请联系 cloudcommunity@tencent.com 删除。

本文参与 腾讯云自媒体同步曝光计划  ,欢迎热爱写作的你一起参与!

评论
登录后参与评论
暂无评论
推荐阅读
编辑精选文章
换一批
OFC 2025:AI高速互连技术报告(Nvidia)
(该报告是今年OFC上OIF光互连论坛的开场报告,其实也没有太多新的信息,偏科普性质,简单收集一下)
光芯
2025/04/19
2510
OFC 2025:AI高速互连技术报告(Nvidia)
AI算力革命驱动光模块产业跃迁:800G规模化部署与1.6T技术竞速下的市场新纪元
自2023年起,以生成式人工智能(AIGC)和大型语言模型(LLM)为代表的AI技术取得突破性进展,ChatGPT等应用的爆发性增长对算力基础设施提出了前所未有的需求。训练和推理任务所需的计算资源呈指数级上升,直接推动全球云计算数据中心扩容与升级。在这一背景下,高速光模块作为数据中心内部及互联的核心传输载体,迎来了历史性发展机遇。其中,800G光模块因其高带宽、低时延的特性,成为满足AI算力需求的关键组件,市场部署节奏较预期大幅提前。行业头部厂商如中际旭创、Coherent等已实现800G产品量产,而更前沿的1.6T光模块研发竞赛也已启动,预计2025年进入商用阶段,标志着光通信技术正式迈入“T级时代”。
武汉格凌科技
2025/04/27
2600
AI算力革命驱动光模块产业跃迁:800G规模化部署与1.6T技术竞速下的市场新纪元
博通OFC2025:光互连的“三体革命”,AI算力的管道之战
如果说AI算力是数字时代的石油,那么光互连技术就是输油管道——它的容量和效率,直接决定了算力的“开采成本”。而2025年的OFC大会上,博通用一场技术矩阵的“饱和式攻击”,宣告了这场管道战争的终局逻辑:谁能定义光互连的物理层规则,谁就能掌控下一代AI集群的命脉。
通信行业搬砖工
2025/04/07
3480
博通OFC2025:光互连的“三体革命”,AI算力的管道之战
OCP EMEA 2025:华为 & 腾讯的LRO可插拔模块(VCSEL/SiPh)验证进展
在OCP EMEA 2025上,来自华为公司的Maxim Kuschnerov发表了题目为LRO-based Pluggable VCSEL and SiP Transceivers for AI clusters的报告,该报告的第二单位为腾讯。该报告的亮点主要在VCSEL上,展示了128端口的4*100G VCSEL LRO模块误码率全部在1e-8以下,并且支持100m OM4传输,是一套当下就可以获取的支撑大规模计算集群互连的解决方案。重点强调了要从整体系统上来考虑各子模块的设计和协同优化,即使在无法获取先进芯片的前提下,仍然可以通过整体的优化,获得性能更优的系统。
光芯
2025/05/12
920
OCP EMEA 2025:华为 & 腾讯的LRO可插拔模块(VCSEL/SiPh)验证进展
OFC 2025预热(二):短距光互连的明星初创公司们
今天来看看OFC 2025上那些明星初创公司都介绍了哪些有意思的进展。主要介绍的公司之前都有陆续写过,包括Ayar labs,、Lightmatter、Celestial AI、OpenLight、Xscape、Lucidean等。Lightmatter和Celestial AI的验证结果展示感觉是脚步最快、最惊艳的(也体现到他们的融资上),Ayar Labs在瞄准大规模制造优化耦合封装方案,而Xscape、Lucidean公司也有了不俗的进展,Nubis展示了新的应用场景,奇点光子开始露面,Openlight平台在持续演进,昨天Tower新闻稿提到的400G/lane技术看会不会在会场有介绍。
光芯
2025/04/08
2940
OFC 2025预热(二):短距光互连的明星初创公司们
OFC 2025预热(一):大厂的一些关于数据中心光互连的邀请报告
OFC 2025周末就要开了,看点多多。今天先来看看会议上大厂们在数据中心光互连这一块会有哪些报告分享吧。
光芯
2025/04/08
3250
OFC 2025预热(一):大厂的一些关于数据中心光互连的邀请报告
OFC 2025 Google报告:AI时代的光通信挑战
在OFC会议的数据中心峰会上,谷歌带来了一场深度分享,直指AI和ML时代光通信技术面临的关键问题。报告中,谷歌明确指出可靠性与可用性、功耗、带宽规模三大“潜在砖墙”,并结合实际案例与数据,剖析挑战本质及解决思路 。
光芯
2025/04/22
1490
OFC 2025 Google报告:AI时代的光通信挑战
OCP 2024旭创报告:硅光LPO、可安装(mountable)的CPO
旭创的于让尘博士在OCP 2024上做了报告,主要介绍了硅光在AI xPU Scale up的应用,包括可靠性、成本、功耗、集成度的优势以及LPO和Mountable CPO的解决方案。
光芯
2025/04/08
1480
OCP 2024旭创报告:硅光LPO、可安装(mountable)的CPO
浅谈CPO与LPO,到底有什么不一样?
传统的光模块是独立于交换芯片之外,通过铜缆或光纤与其他电子组件相连,这种方式在高速信号传输过程中容易产生较大的功耗和信号损耗。特别是,DCI等网络速率逐渐从400G发展到800G,甚至1.6T,不久的将来可达到3.2T,单个光模块的功耗也在增加。
通往ICT之路
2024/04/10
4.5K0
浅谈CPO与LPO,到底有什么不一样?
DesignCon 2025: Ranovus/联发科/富士康的CPO方案
共封装光学技术通过紧密集成ASIC与光学引擎,显著降低了AI计算中的互连功耗(达75%)与延迟,同时提升I/O密度。在Ranovus和联发科/富士康的这个合作项目中展示的8×800G CPO系统已验证其在信号完整性、热管理和兼容性方面的可行性,为下一代200G及更高速率的光互连奠定了技术基础。随着UCIe等先进封装技术的成熟,CPO有望成为超大规模数据中心与AI集群的核心互连方案。
光芯
2025/04/08
2570
DesignCon 2025: Ranovus/联发科/富士康的CPO方案
OFC 2025 PDP:单波400G的III-V(NTT/华为)、铌酸锂(Hyperlight/住友)及硅光(Aloe)
OFC 2025 PDP又增添了好几个单波400G的验证结果,其中有华为的540 Gbps EML传光纤30km的报道(OFC 2025 PDP:华为的110 GHz带宽、540 Gbps EML+30km传纤实验)。除此之外,Hyperlight用Ciena的3nm 448Gbps Serdes完成了8×400G的3.2T 2km DR8和FR8实验;NTT也演示了8通道的无制冷高带宽的InP MZM的3.2T 500m传输;住友基于前两年做的集成电光均衡器的高带宽铌酸锂(封装后带宽>100GHz)演示了单波400Gbps 传输(不过是C波段的),PDP之外Coherent是发布了新闻稿会在OFC现场演示400 Gbps的差分EML。
光芯
2025/04/08
4700
OFC 2025 PDP:单波400G的III-V(NTT/华为)、铌酸锂(Hyperlight/住友)及硅光(Aloe)
CPO光模块的技术革新与产业困局:1.6T/3.2T时代可插拔方案的持续主导
共封装光学(Co-Packaged Optics,CPO)作为硅光技术的重要演进方向,正在引发数据中心互连架构的深层变革。该技术通过将光引擎与交换芯片集成于同一封装基板,构建起"光电协同设计"的新范式,较之传统可插拔光模块展现出显著优势:
武汉格凌科技
2025/04/15
2340
CPO光模块的技术革新与产业困局:1.6T/3.2T时代可插拔方案的持续主导
Accelink USA:1.6T光模块与224G/lane技术的演进与突破
本报告来源于OCP EMEA 2025峰会上来自Accelink USA Corporation的Tiger Ninomiya发表的题目为Enabling Scalable AI with 1.6T optics based on 224G/lane的报告。
光芯
2025/05/19
1120
Accelink  USA:1.6T光模块与224G/lane技术的演进与突破
LPO 光模块:下一代数据中心网络的节能高效新选择
LPO(Linear Pluggable Optics,线性可插拔光模块)是光通信领域针对高速率、低功耗需求推出的创新解决方案。其核心突破在于摒弃传统光模块中的 DSP(数字信号处理)芯片,采用线性模拟技术直接驱动光电器件,实现信号传输的简化与能效优化。
武汉格凌科技
2025/04/21
2670
LPO 光模块:下一代数据中心网络的节能高效新选择
Intel 的光学互连方案 -- CPO 与 OCI 以及 4Tbps 光学小芯片
这两天 Intel 公司在 “HotChips 2024” 中介绍了它的”4Tb/s Optical Compute Interconnect Chiplet for XPU - to - XPU Connectivity“。翻译过来就是 ”用于 XPU 到 XPU 连接的 4Tb/s 光计算互连芯片“。
通往ICT之路
2024/08/30
8290
Intel 的光学互连方案  --  CPO 与 OCI 以及 4Tbps 光学小芯片
数据中心的黑科技——到底什么是NPO/CPO?
所谓“东数西算”,其实就是数据中心的任务分工调整。我们将东部沿海地区的部分算力需求,转移到西部地区的数据中心完成。
鲜枣课堂
2022/12/30
1.3K0
数据中心的黑科技——到底什么是NPO/CPO?
Cignal AI的数据中心光组件初创公司信息汇总
原始网页链接:https://cignal.ai/2024/10/optical-component-startup-tracker/
光芯
2025/04/08
1690
Cignal AI的数据中心光组件初创公司信息汇总
从铜到光,从电交换到光交换,GTC 2024 和 OFC 2024 没有老中医!
至少可以说,上个月非常令人兴奋!Dell'Oro有机会参加了业内最具影响力和最受瞩目的两个活动:NVDA GTC和OFC。
用户6874558
2024/04/30
3660
从铜到光,从电交换到光交换,GTC 2024 和 OFC 2024 没有老中医!
800G 和 1.6T 网络的挑战!
我们知道,提高波特率会加快符号在信道中的传输速度,但可能导致信号衰减的增大。增加脉冲幅度调制方案(PAM)可使每个符号发送更多的比特,但误差幅度更低,阈值更严格。
通往ICT之路
2024/04/09
3360
800G 和 1.6T 网络的挑战!
OFC2024:关于 LPO 与 LRO
近年来,数据中心技术的进化轨迹中,AI/ML 后端网络的扩张速度超乎我们的预见。今年的 OFC 大会无疑是对这一现象的最佳诠释:规模之宏大,前所未见。
通往ICT之路
2024/05/09
2.4K0
OFC2024:关于 LPO 与 LRO
推荐阅读
相关推荐
OFC 2025:AI高速互连技术报告(Nvidia)
更多 >
领券
问题归档专栏文章快讯文章归档关键词归档开发者手册归档开发者手册 Section 归档