为何敢?
首先是在架构上的创新,自主研发的稀疏注意力机制与混合专家模型,使得V4系列在处理百万级Token的长上下文时,算力消耗仅为此前版本的27%,键-值缓存占用降低到10%,从而在单位推理成本上实现了技术性下降;
其次是算力层面的自主化,通过深度适配昇腾等国产算力平台,减少了对海外高端算力的依赖,降低了硬件采购成本;
第三是工程侧的持续优化,在推理环节进行极致效率提升,提高了算力利用率,并通过规模效应分摊固定成本,形成了“使用量增长反哺成本降低”的良性循环。这种由技术进步驱动的成本下降,为价格调整提供了可持续的基础。
几乎在同一时间,据彭博社报道,DeepSeek正在推进一轮规模高达700亿元人民币(约合100亿美元)的融资。若最终完成,这将有望创下中国AI企业史上最大单笔融资纪录。知情人士透露,此轮融资投前对DeepSeek的估值可能约为450亿美元。潜在的投资者包括国家人工智能产业投资基金、腾讯、IDG资本、砺思资本等机构,网易与京东也在洽谈加入。
报道称,DeepSeek创始人梁文锋在投资者会议上表示,公司将继续优先进行突破性的人工智能研究并追求实现通用人工智能(AGI),同时承诺继续开发开源AI模型。梁文锋本人可能在此轮融资中个人出资约200亿元人民币。