内存不再是配角,而是决定本地智能体能否流畅运行、大模型能否高效推理、用户体验能否真正跃升的核心器件。
这个“寻货”有固定流程:CPU先在最快的L1缓存(Cache)里找,找不到就逐级下探到L2、L3缓存,最后才到内存“仓库”。如果内存“仓库”也没有,就只能去硬盘这个“远郊总库”调货。这个流程越长,等待时间就越长,效率也越低。
在找到数据之后,数据的传输速度也很关键,这取决于内存的容量和带宽。容量决定“仓库”能堆多少“货”,带宽决定连接“工厂”与“仓库”的“道路”有多宽——路越宽,同一时间能传输的数据就越多。需要指出的是,从CPU发出指令到数据最终送达的总耗时,称为延迟,它涵盖了前面寻址等待和后面数据传输的全过程。延迟越低,CPU等待时间越短,响应也就越快。
如今的主流PC采用的DDR内存是“双倍数据速率”存储器,它能在时钟信号的上升沿和下降沿各传一次数据。其带宽公式为:
带宽 = 等效频率(MT/s)× 位宽 ÷ 8
位宽是数据通道宽度(例如,双通道为128位),除以8是将比特换算为字节。
当CPU核心、核显与AI引擎同时争抢数据时,若这条“运货道路”不够宽,再强的算力也会卡在“等货”环节,无法全力运转。这就是为什么内存带宽至关重要的原因。
如今,生成式AI工作负载正加速向本地计算迁移,游戏玩家和内容创作者成为率先拥抱高性能PC的核心群体。这些应用场景对内存提出了新的要求:更大的容量以装载AI模型和大型素材,更高的带宽以支撑并行计算,更低的延迟以保证实时响应。本质上,市场需要一条能够让CPU与DRAM之间的接口持续扩展、带宽不断攀升的演进路径。
实际上,生成式AI工作负载对内存子系统的需求与传统应用截然不同。以本地运行的大语言模型为例,其推理过程需要维持持续的上下文状态、高频的参数读取,以及模型权重与KV缓存之间的反复数据交换。这对内存带宽、延迟和容量提出了三重挑战。
而在传统PC内存架构中,时钟信号由CPU直接驱动至DRAM颗粒。然而,当数据传输速率超过6,400 MT/s时,信号完整性面临严峻挑战,比如,电源噪声诱发抖动、串扰、信号衰减等问题使得时序裕量急剧缩小,系统稳定性难以保障。
为此,JEDEC协会在2023年底正式引入了“时钟驱动器(CKD)”的概念。其核心作用是从主机端接收时钟信号,进行恢复、整形与放大,再重新分配给DIMM上的每一颗DRAM颗粒。这相当于在内存模块内部建立了一个“信号中继站”,有效抑制抖动,保证高速传输下的时序精度。
为了满足客户端的内存带宽要求,Rambus将多颗芯片协同工作,构成一个完整的内存模块控制与供电生态。2025年5月,Rambus推出了面向下一代AI PC内存模块的完整客户端芯片组,包含两款用于客户端计算的全新电源管理芯片(PMIC)——PMIC5200和PMIC5120。这两款PMIC与客户端CKD和串行检测(SPD)集线器共同组成了适用于AI笔记本电脑、台式电脑和工作站内存模块的完整芯片组解决方案。

如今,该公司在第一代芯片组的基础上,推出了第二代客户端内存接口芯片组产品。根据Rambus内存接口芯片部门产品营销副总裁John Eble的介绍,此次发布的客户端芯片组包括三颗核心器件:
CKD02。负责时钟信号的恢复与再分配,相比于第一代CKD01(支持6,400 MT/s至7,200 MT/s),CKD02将运行频率范围扩展至8,000 MT/s至9,600 MT/s,并在抖动抑制、功耗控制和信号完整性方面进行了全面优化。
PMIC5120。针对高带宽、大容量模块优化,提供高于JEDEC标准的转换效率,减少功率损耗与发热。
SPD1605(SPD集线器 + 温度传感器)。存储非易失性配置信息,支持I2C/I3C总线通信,并集成片上温度监测,为模块级热管理提供数据支撑。
9,600 MT/s的带宽再配合CQDIMM等高密度模块,使得系统能够支撑更大的上下文窗口,从而提升AI回答的一致性、逻辑推理质量与响应速度。对此,John Eble指出:“AI推理需要这种带宽和容量,以确保响应时间和质量。我们的芯片组围绕这些关键点进行设计,以非常稳定的方式实现新的数据速率和容量。”

此外,Rambus还支持LPCAMM2模块,其最高速率可达10,666 MT/s,将LPDDR5X引入可维护、可升级的模块化形态,进一步拓展了AI PC在笔记本电脑领域的设计弹性。
总的来看,Rambus针对客户端提供DDR5 CSODIMM/CUDIMM/CQDIMM(PMIC + CKD + SPD集线器)和LPCAMM2(PMIC + SPD集线器)所需的完整内存接口芯片组。
值得关注的是,Rambus针对客户端的技术并非“从零开始”。该公司在过去多年中,已在DDR5服务器RDIMM、MRDIMM、LPCAMM2等高端内存模块中积累了丰富的芯片组经验,包括RCD、PMIC、SPD Hub、温度传感器等器件的量产能力。
在服务器领域,Rambus的产品已支持高达8,000 MT/s的RDIMM速率,并覆盖MRDIMM、SOCAMM2等六种行业标准内存架构。如今将这些高可靠性、高性能的组件技术下沉至客户端CUDIMM/CSODIMM模块,是一种典型的技术溢出战略。
具体而言,Rambus在服务器端积累的信号完整性管理、电源完整性优化、抖动抑制算法、高密度封装设计等能力,被直接迁移至客户端芯片组中。例如,CKD02所采用的时钟恢复与抖动抑制技术,正是来源于服务器RCD芯片的成熟IP。这种“服务器先行、客户端跟进”的技术路径,有效降低了研发风险,也确保了客户端产品在高速运行下的稳定性。
此外,John Eble也强调称,提供经过预验证的完整芯片组,是降低客户风险、缩短产品上市时间、简化供应链管理的核心策略。对于模块制造商而言,从单一供应商处采购全套芯片组,意味着更少的兼容性调试、更快的认证流程和更稳定的供应保障。
尽管技术突破令人振奋,但Rambus也清醒地意识到,当前PC内存市场面临的成本压力。根据Gartner的数据,内存在PC整体BOM中的成本占比已从2025年的约16%上升至23%,涨价潮正在影响入门级和中端市场的产品规划。
Rambus大中华区总经理苏雷表示,Rambus正与大陆及台湾的PC厂商紧密沟通,帮助其通过产品细分与定位调整来对冲涨价压力。与此同时,Rambus通过提供完整芯片组、优化BOM成本、协助客户方案评审等方式,降低整体系统成本,加速高性能内存方案向主流价位渗透。
在性能冗余方面,Rambus当前的芯片组已覆盖JEDEC针对DDR5和LPDDR5内存模块的整个生命周期,未来1至2年内具备充足余量。而对于10 GT/s(也即是10,000 MT/s)以上的更高速率,John Eble指出:“LPDDR5X已经支持到10.7 Gbps,技术上已经突破了那条线。若要进一步提速,可能需要DDR6或LPDDR6等下一代内存标准。”
总而言之,Rambus此次发布的芯片组并非孤立产品,而是其全面客户端内存战略的一部分。从第一代CKD01到第二代CKD02,再到未来支持更高速率的产品路线图,Rambus正与DRAM原厂、模组厂商、PC OEM及CPU平台方深度协同,推动整个生态向前演进。
在技术层面,Rambus将继续推进更高带宽、更优能效、更广泛平台支持的研发方向,重点关注信号完整性、电源管理、时钟架构与封装形式等关键环节。在商业层面,通过提供预认证的完整芯片组、简化供应链、降低客户集成风险,Rambus正试图在AI PC的内存升级浪潮中占据标准制定者的生态位。
正如苏雷所言:“我们的目的只有一个,帮助客户更快地把产品推向市场,减少中间环节,控制整体系统成本。”