预计到2030年,大模型推理成本将暴降90%,但前沿AI依旧昂贵。
Gartner高级总监分析师Will Sommer对此分析道:“首席产品官(CPO)不应将商品词元的贬值与前沿推理的普及混为一谈。如今试图用廉价词元掩盖架构效率低下的企业,明天将会发现实现智能体规模化(即让高级AI自主、高效地工作)遥不可及。”
为了应对这一挑战,Gartner为企业首席产品官们提出了一些建议:构建一个能够智能协调不同模型工作负载的平台。其核心原则是将常规、高频的任务分配给更高效、更专注的小型领域专用模型,这些模型能以极低的成本出色完成特定工作。同时,必须将那些前沿、高成本的大型模型严格限制在高价值、高利润的复杂推理任务上,从而在控制成本的同时,最大化前沿AI的商业价值。