075582814553
开源人工智能渐成气候,成本攀升推动转向小型模型

香港天翔電子有限公司 / 03-19 16:31

随着AI系统从少数企业掌控的资本密集型大型语言模型向外发展,小型语言模型正凭借开源系统迅速崛起,其开放权重体系也在迅速缩小与封闭平台之间的性能差距。

最新研究显示,开放权重的AI模型有望节省数十亿美元成本,即便企业仍普遍青睐封闭式系统。

随着AI系统从少数企业掌控的资本密集型大型语言模型(LLM)向外发展,小型语言模型(SLM)正凭借开源系统迅速崛起,其开放权重体系也在迅速缩小与封闭平台之间的性能差距。

Mozilla基金会主席Mark Surman在接受《国际电子商情》姊妹刊《EE Times》采访时表示,训练和运行大型AI模型所需的高昂成本正推动行业寻求更加节能、低成本的创新路径。

“开源AI的成本结构与传统开源软件截然不同,因为涉及计算资源、能源和基础设施,”Surman解释道,“今年,行业将更关注面向特定应用场景的小型语言模型,同时通过分布式训练提升效率,并利用闲置计算资源。”

他将Meta发布的Llama模型视为关键转折点。他指出,在此之前,大型语言模型似乎注定难以开源——几乎所有核心技术都被OpenAI和Anthropic等公司牢牢掌控。

“对多数人来说,人工智能就是聊天机器人或能预测阅读偏好的社交媒体推送。人工智能无处不在,但其底层架构如同乐高积木一样由不同组件构成,”Surman解释道,”当用户使用聊天机器人或刷社交媒体信息流时,OpenAI、Meta或阿里巴巴等公司已按照自己的方式组装好这些积木,并将它们封装成一个‘黑盒’。开源意味着可以接触到所有积木。"

打破黑箱

Surman指出,要判断AI是否真正“开放”,必须观察系统的各个组成部分。他列举了多款已向开发者开放的模型,包括美国大型科技公司的Gemma和GPT-OSS,中国的Qwen和Kimi,以及法国Mistral AI的系列模型。

区分开放权重(openweight)模型与完全开源(fully opensource)模型至关重要。开放权重模型的预训练过程处于黑箱状态,开发者虽可对模型进行微调和适配,却无法窥见到其构建方式。而完全开源模型则允许开发者查看训练数据和预训练过程中的检查点。虽然目前已有完全开源模型问世,但其性能仍落后于开放权重模型和封闭模型。Surman表示,需要更多投资来提升完全开源模型的能力。

【编者按:开放权重模型将AI模型的关键参数,即‌权重‌(weights),向公众免费开放,允许任何人下载、在本地设备上运行或进行微调的模型。但与“完全开源”模型不同,开放权重模型‌通常不公开训练数据、训练代码或完整架构细节‌‌。】

然而,开源AI并不仅限于模型本身。它还包括开源数据集、用于编排计算基础设施的开放式方案,以及构建AI系统的开放架构和协调方式。“Transformer、大型语言模型、强化学习和智能体(Agent)框架等技术已经广为人知。开放权重模型与专有模型正在能力上逐渐接近,足以满足大多数用户的需求,”Surman透露道。

同时,学术界也开始量化这一转型带来的经济效益。

数十亿美元的“低估”

2025年11月,麻省理工学院数字经济计划研究科学家、Linux基金会首席科学家Frank Nagle与佐治亚理工学院谢勒商学院信息技术管理领域的助理教授Daniel Yue共同发表了一篇论文,为Surman的观点提供了实证支撑。

他们研究了大型语言模型(LLM)推理市场——即训练模型根据用户指令生成输出的环节,也是目前AI日常支出最集中的领域。他们发现,按价格和性能来看,开放权重模型的利用率远低于其应有水平。

研究使用了OpenRouter的数据,该平台可将API请求分发至数十家推理服务商,覆盖市场0.3%-1.06%的消耗总量。研究人员追踪了2025年5月至9月期间的每日Token使用量、价格及模型供应情况。

研究结果揭示了人工智能经济中的一个悖论:OpenAI、Anthropic和谷歌等公司的封闭模型仅通过专有API访问处理了80%的Token,并贡献了95%以上的收入。而开放权重模型(其权重可公开获取并由任意推理服务商托管)处理了20%的Token,却只获得约4%的收入。

两者的价格差距更明显。平均而言,开放权重模型平均成本仅为闭源模的15.66%,也即是后者价格约为前者的6倍。Surman解释说,这种差异来自自由度:“使用开源技术,你无需支付高额租金,还兼具灵活性和可扩展性。”

论文指出,开源模型成本更低,这源于结构性差异。由于任何机构都能托管开源模型,众多推理服务商竞相提供相关服务,从而推动其价格趋近边际成本。相比之下,封闭模型通常仅由一到两家原始开发公司及其可能的云合作伙伴提供服务,这使得它们能够维持较高的溢价。

尽管价格差异巨大,但两者的性能差距却并不明显。Nagle和Yue的研究推断,在GPQA、MMLU Pro、LiveCodeBench、LM Arena等主流的基准测试中,开放权重模型大约能达到封闭模型90%的性能。其中GPQA研究生级推理测试得分89.6%。根据其研究论文,开源模型追平封闭模型所需的时间也在缩短:2024年上半年平均需要27周,2024年下半年缩短到17周,2025年上半年进一步缩短到13周。

即便在回归分析中纳入价格与性能指标后,开源模型的实际使用率仍比同类封闭模型低63%至88%。研究还发现,在多个案例中,封闭模型不仅价格更高,性能也逊于现有开源替代方案,但用户仍持续选择前者。论文模拟了将这些明显“劣势”的封闭模型替换为更优的开放模型的场景,仅在OpenRouter平台上一年即可节省1.04亿至1.46亿美元。扩展到整个推理市场后,三种独立估算方法显示,潜在但尚未实现的节省规模为201亿至483亿美元/年,其中优选估算值为248亿美元。

AI采用过程中的信任与转换成本

值得注意的是,Nagle和Yue并未认为用户的行为是不理性的。他们的研究表明,转换成本、品牌信任、安全顾虑,以及标准化基准测试可能无法反映实际性能差异等因素,共同解释了用户对封闭模型的偏好。论文指出,这些隐藏因素所造成的经济影响远超以往认知。

Surman援引美国商务部委托的一项研究指出,开放权重模型与封闭模型在边际风险上并无显著差异。“两者都可能被破解,”他表示,“虚假信息和深度伪造技术的危害取决于部署者的身份与方式。在Mozilla,我们参与了ROOST(Robust Open Online Safety Tools)基金会项目,该基金会开发基于AI的信任与安全软件,供平台用于检测和清除有害内容。”

他进一步阐释:“开源人工智能的商业模式包括服务收费、技术支持收费,以及让使用相同软件的用户共享资源。开源技术向来以可审计性和透明度著称——任何人都能查看代码,当问题出现时,众多开发者可共同修复。而专有系统在人工智能领域基本不受监管,关键在于你选择信任谁。”

Surman指出,科技行业早已建立在开源基础上。他列举了亚马逊云服务、微软Azure、谷歌云平台等云服务商,以及Meta和X等公司,均运行在Linux等开源软件之上。

谈及围绕许可协议的持续争论,Surman阐述了Mozilla的立场:“宽松许可仍是正确选择。开源通过许可协议运用版权法,赋予修改和共享成果的权利。要实现负责任的人工智能应用,我们需要安全防护栏技术、商业流程和国家层面的法律,而不是去改变开源许可证。”

随着全球秩序重组,各国正积极探索促进广泛参与的途径,为开源人工智能创造新空间。面对被誉为数字技术新纪元的AI浪潮,Surman回顾了计算机时代、个人电脑时代、网络时代及互联网时代的演进历程,指出开源始终是抵制集中化的重要力量。

“开源人工智能若能成功,意味着更多人能参与塑造这个社会、经济与技术的新纪元,” Surman说,“五年后,我期待看到人工智能的来源更加多元,更多人成为创造者而非单纯的消费者。”


Processed in 0.122866 Second , 36 querys.