075582814553
OpenAI发布首款自研AI芯片Jalapeño,9个月流片、推理成本直降50%

香港天翔電子有限公司 / 06-25 11:41

OpenAI与博通(Broadcom)联合揭开了业界期待已久的首款自研AI推理芯片“Jalapeño(哈拉贝诺辣椒)”的面纱。

美东时间2026年6月24日,OpenAI与博通(Broadcom)联合揭开了业界期待已久的首款自研AI推理芯片“Jalapeño(哈拉贝诺辣椒)”的面纱。这不仅是OpenAI从纯模型公司向全栈AI基础设施提供商转型的里程碑事件,更标志着AI芯片市场格局正在发生深刻重构。

图1:OpenAI与博通(Broadcom)联合发布首款自研AI推理芯片Jalapeño 图片来源:OpenAI官网

9个月极速流片:AI自己造芯片的时代来了

通常情况下,从零开始设计一块ASIC芯片需要1.5到2年的时间。而Jalapeño从初始设计到制造流片仅用了9个月。OpenAI硬件主管Richard Ho将此归因于深度软硬件协同开发:OpenAI不仅用自家前沿模型辅助架构探索、功耗仿真与强化学习优化,博通也提供了业界顶尖的硅实现能力。

正如OpenAI总裁Greg Brockman所言:“我们利用服务于用户的前沿模型,来优化运行未来模型的基础设施。”在实验室中,Jalapeño工程样品已以目标频率和功耗成功运行GPT-5.3-Codex-Spark等复杂强化学习任务,早期测试显示每瓦性能"显著优于当前最先进的AI加速器"。

与通用GPU不同,Jalapeño被归类为ASIC(专用集成电路),是围绕OpenAI对LLM推理工作负载的深度理解从零架构建的。其架构核心在于降低数据移动、平衡计算-内存-网络的资源分配,使实际利用率更接近理论峰值。OpenAI强调,Jalapeño不仅支持现有模型,也适配未来新一代模型的推理需求。它的目标是将当前领先加速器的吞吐能力与最快专用推理系统的低延迟结合起来,这使其在ChatGPT、Codex以及未来Agent产品的规模化交互场景中极具竞争力。详细的性能技术白皮书将在未来数月内发布。

推理成本骤降50%,吉瓦级部署野心

虽然OpenAI官方新闻稿中针对Jalapeño带来的成本节约的表述相当保守,仅透露其“每瓦性能大幅优于当前最先进水平”,未给出具体百分比。

但据彭博社报道,博通CEO陈福阳(Hock Tan)透露,早期内部测试显示,相较于当前主流AI GPU,Jalapeño可实现约50%的推理成本节省。对于每天处理数亿次API调用和ChatGPT请求的OpenAI而言,即使推理成本的边际下降也会显著改善盈利模型。

OpenAI的公告还指出,Jalapeño的设计不仅支持OpenAI自身的工作负载,还支持整个行业当前和未来的LLM应用。

同时,Hock Tan表示,Jalapeño将于今年开始与微软和其他合作伙伴一起部署在千兆瓦级数据中心,但目前尚不清楚该处理器是否会专门用于OpenAI的工作负载,还是也会提供给其他用户使用。他还特别强调,这只是一个“多代路线图的起点”,OpenAI与博通的目标是共同建设吉瓦(gigawatt)级算力集群。

这意味着,OpenAI有可能将其硬件出售给第三方,前提是它能从博通和台积电获得足够的供货。

Jalapeño是一个多代计算平台的第一步,该平台计划于2026年底前完成初始部署,并在未来几年内逐步扩展,它将OpenAI设计的加速器与博通的芯片实现、网络和连接技术相结合,并融合了Celestica在电路板、机架和系统方面的专业技术。

去英伟达化加速,全竞争白热化

业内人士普遍认为,Jalapeño的发布是科技巨头集体挑战英伟达市场主导地位的又一注脚。谷歌TPU已成熟商用,微软Maia同步推进,亚马逊Trainium持续迭代,如今OpenAI正式入局——定制AI加速器的阵营空前壮大。但OpenAI并非要完全“抛弃”英伟达,Brockman坦言“我们根本无法足够快地获得算力”。

目前,OpenAI同时在向英伟达、AWS、AMD和Cerebras等多方采购芯片,Jalapeño是对其爆炸性算力需求的结构性补充。博通也从这一合作中收获丰厚——其Tomahawk网络芯片和高速互联技术将伴随Jalapeño平台实现规模化变现。

Jalapeño的亮相标志着AI产业的竞争维度正在发生根本性跃迁——从单一的模型能力比拼,升级为“模型+芯片+系统+网络”的全栈基础设施竞赛。当OpenAI从GPT-5的开发者变身为Jalapeño的设计者,当9个月成为芯片研发的新速度基准,当“AI辅助设计AI芯片”从概念走向量产——这场芯片战争才刚刚拉开序幕。


Processed in 0.113095 Second , 36 querys.