075582814553
数据中心光模块市场五年内翻倍,内部互联成最大增长引擎

香港天翔電子有限公司 / 06-09 21:31

数据中心内部网络究竟面临的是一场革命还是一次演进?

AI正在从根本上改变数据中心内部互联的角色,以至于数据中心内部网络正变得与计算本身同等关键。数据中心内部的后端网络(负责将AI加速器彼此互联,并与内存连接以实现工作负载分发)实际上正在成为计算系统的延伸。

那么,数据中心内部网络究竟面临的是一场革命还是一次演进?或许两者兼而有之。

AI工作负载的爆发式增长正在催生新技术,但这些技术并非凭空而来,而是依托现有方案,建立在延续多年的创新脉络之上。

数十年来,铜缆一直是数据中心内部连接的默认选择。铜的价格低廉、易于部署,且在短距离内表现良好。但随着数据速率攀升和传输距离延长,铜缆因衰减和电磁干扰导致信号完整性急剧恶化,逐渐力不从心。

相比之下,光纤能够以更高的数据速率、在更长的距离上传输信号,且损耗极低、不受电磁影响。目前,几乎所有超过约5米的400 Gbps数据中心连接(即单机架之外的任何高性能连接)都已转向光纤。更快的AI加速器甚至正在推动机架内部连接也向光纤过渡。最终,AI工厂数据中心的每一条连接都将通过光纤实现。

过去几年,光链路速率经历了令人瞩目的跃升,从100 Gbps迅速推进到400 Gbps、800 Gbps,如今1.6 Tbps也已崭露头角。然而,要满足AI训练和推理的需求,仅靠更快的端口还远远不够。

AI重新定义数据中心网络

传统上,数据中心采用纵向扩展(scale-up)策略实现增长,即在单个机架内添加更大规格的服务器或更多处理器。现代AI正在颠覆这一范式。大型AI模型和分布式训练需要协调数千个处理器/加速器同步运行。这意味着,数据中心建设需要转向横向扩展(scale-out),将海量节点跨机架、跨排、甚至跨相邻建筑互联,形成一个统一的计算结构,协同处理共享任务。

虽然分布式计算并非新概念,但这些AI计算架构在规模和性能上已达到前所未有的水平。业界正在构建庞大的AI训练集群,在个位数微秒级延迟下,这些横向扩展网络可处理每秒数太比特(Tbps)的流量,将数千个机架互联起来,每个机架内部配备数十颗GPU。基于对大型AI集群的公开测算(以整个平台的光学器件平均配置计),此类部署通常每颗GPU需要配备3至6个光模块。在一个拥有数十万颗GPU的数据中心内,仅服务器与机架顶部(ToR)交换机之间,以及ToR交换机与核心交换机之间的短距连接,所需光模块数量就可能超过100万个。

事实上,LightCounting等行业分析师预测,以太网光收发器和共封装光学器件的销售额将在未来五年内翻倍,其中数据中心内部应用将贡献大部分增长。全球年需求量预计在未来几年内达到数亿只,以支撑AI集群的大规模部署。

现在的可插拔光学模块:FRO、LRO、LPO

为支撑AI带来的光通信爆发式增长,创新不仅聚焦于更高速的链路,更关注光学模块自身的设计与部署方式。在数据中心内部,能效与密度是关键考量因素。这催生了新型光通信架构,既降低了功耗和尺寸,又提升了部署灵活性。

传统可插拔光学模块采用全重定时光模块(FRO),在发送端和接收端均集成信号处理功能。这带来了出色的性能与长距离传输能力,但代价是较高的功耗和延迟。新兴方案则采用了更轻量的设计思路。线性接收光模块(LRO)通过将信号处理交由交换机ASIC完成,从而简化接收路径,显著降低模块功耗和延迟。进一步延伸这一理念,线性驱动可插拔光模块(LPO,或称线性驱动)将主动信号处理功能从可插拔模块中完全移除,从而在短距离链路上实现极低功耗与最小延迟,前提是主机设备需支持该模式。

重要的是,这三种方案在现代数据中心网络中并存。FRO继续服务于对传输距离和可靠性要求较高的应用场景,而LRO和LPO则在要求高吞吐量、短距离传输的数据中心内部链路中加速普及,这些场景对能效与密度要求极高。这些方案共同勾勒出光通信技术的演进路径——在数据中心网络为AI实现革命性扩展的过程中,实现了性能与功耗的平衡。

光学的未来演进:NPO、CPO、XPO

可插拔光学模块仍在被重新定义。2026年初,一个行业联盟提出了一种名为超密集可插拔光学(XPO)的新概念,旨在大幅提升前面板光接口密度——这是数据中心内部互联的关键瓶颈。单个XPO可提供前所未有的12.8 Tbps带宽,虽然尺寸大于八通道小型可插拔模块(OSFP),但相比当今的可插拔方案,仍可将前面板密度提升约四倍。由于XPO集成了液冷技术,这些模块还能支持功耗更高的相干光学器件。

与此同时,业界也在探索更为激进的光学集成方案。

这一转变的核心思路很简单:让光学器件更靠近计算或交换芯片,可以减少信号损耗及相应的补偿功耗,同时克服前面板的空间限制。

近封装光学(NPO,亦称板载光学)将光学引擎从前面板移至更靠近交换芯片的位置,从而缩短了电信号传输距离,提升效率。这种方式在功耗和信号质量方面带来显著改善,但牺牲了灵活性——因为光学器件不再易于更换。

共封装光学(CPO)则将这一理念推向极致,将光学器件直接集成到交换芯片封装内部。通过大幅缩短电互连距离,CPO有望实现超低延迟和卓越的能效。但与此同时,它也对长期以来的可维护性、制造兼容性和互操作性假设提出了挑战。

XPO、NPO和CPO共同表明,数据中心内部光学的演进已不仅仅是追求更高速的链路,而是要在AI时代从根本上重新设计光学、电子学与计算如何融合。

AI时代的数据中心互联,既在需求与规模层面经历一场革命,也在数十年的光学技术积淀之上持续演进。


Processed in 0.097524 Second , 36 querys.