DeepSeek凭借极具性价比的技术路线声名鹊起,外界开始怀疑AI算力高额投资是否明智。但北美四大云服务提供商并未就此缓步,今年花在AI基础设施上的支出预计超过3000亿美元。
资本开支急剧扩张
美国时间2月6日,亚马逊在财报电话上披露,2024年第四季度,公司的资本支出达到263亿美元,远高于分析师预期的223亿美元。公司预估2025年的资本支出总额为1000亿美元,同比增长约26%。
亚马逊总裁兼首席执行官安迪·贾西(Andy Jassy)介绍,绝大部分资本支出用在了亚马逊云(AWS)的AI基础设施建设,包括数据中心、硬件、芯片和网络设备。
“除非看到明显的需求信号,否则我们不会采购。”贾西将AI视为一个“千载难逢的商业机会”。
此前2月4日,谷歌母公司Alphabet发布当季财报时也给出了资本支出指引:今年资本支出将达到750亿美元,同比攀升高达43%。
Alphabet首席财务官阿纳特·阿什肯纳齐(Anat Ashkenazi)在财报电话会上说,资本支出这一数字主要反映了公司对技术基础设施的投资,其中,服务器是最大的开支领域,其次是数据中心,“用以支持谷歌服务、谷歌云和DeepMind的业务增长”。
1月24日,Meta首席执行官马克·扎克伯格(Mark Zuckerberg)在其个人社交账号上透露,到今年年底时,Meta将拥有超过130万块GPU,资本支出预计为600亿至650亿美元。相比2024年的392亿美元,资本开支的扩张幅度最高达到66%。
Meta首席财务官苏珊·李(Susan Li)于1月29日的财报电话会上进一步称,服务器仍然是整体资本支出中最大的部分;今年的数据中心支出,将用于大型训练集群的建设以及进入核心建设阶段的高功率密度数据中心。
微软则在今年1月初一篇博客文章中预测,在截至今年6月的2025财年,将为AI数据中心建设斥资800亿美元。另据数据分析平台Visible Alpha的预测,微软和Meta今年都将把超过30%的收入用于资本支出,其中,2025年(自然年)微软的资本支出总额将超过900亿美元。
综合官方数据及第三方机构预测,亚马逊、微软、谷歌和Meta这四家云厂商今年的资本开支超3000亿美元。
推理算力需求长期看涨
自从DeepSeek用较低的成本训练出媲美GPT-4o尖端AI模型,一种质疑开始浮现:是否有必要大规模投资建设高算力基础设施?
相比同属开源阵营的的Meta Llama 3系列模型,DeepSeek-V3的训练成本仅有前者的7%。去年12月底发布的DeepSeek-V3,仅需278.8万H800 GPU小时(使用H800 GPU 进行训练,累计起来的时间总量为278.8万小时),而Llama 3系列模型则多达3930万H100 GPU小时。
“DeepSeek的模式对传统上高投资、高算力的模式带来挑战。”市场咨询机构Omdia首席分析师王珅向南都记者表示,DeepSeek代表大模型一种轻量化的发展方向,但美国云厂商不太可能由于一种新兴技术路线的出现,就完全改变原本的发展模式和方向,因此延续了高算力的支出轨迹。
华泰证券科技与电子行业首席分析师黄乐平撰文分析,DeepSeek对算力需求的影响呈现出短期抑制、长期增长的复杂趋势。短期内,DeepSeek的低成本高效训练方法可能导致训练需求下降。然而,从长远来看,随着模型的普及和应用场景的扩展,推理需求将显著增长。这种趋势类似于“蒸汽机降低煤耗但提升煤炭总用量”的历史现象。
被问及DeepSeek给资本支出带来的影响时,扎克伯格在1月29日的财报电话会上回应称,这并不意味着所需的算力越来越少。“目前我们看到的新趋势之一,是在推理计算时投入更多算力,以生成更高水平的智能算力和更高质量的服务。”扎克伯格提到,Meta为数十亿人提供AI服务,“这和模型预训练是两回事”。
DeepSeek面向市场的过程中,也遭遇算力瓶颈。“AI产品榜”2月5日发布的数据显示,DeepSeek上线20天日活超2000万,达到ChatGPT的四成。伴随现象级“出圈”而来的,是DeepSeek官网和App服务的频繁宕机。受算力吃紧影响,DeepSeek还在2月6日暂停了API服务充值。
采写:南都记者 杨柳
上一篇:DeepSeek今日要闻:称未发行任何虚拟币;张雪峰回应会让其失业;用户量超Gemini
下一篇:ETF盘后资讯|连续反弹!金融科技ETF(159851)收涨3.34%创阶段新高,单日成交超11亿元,中亦科技涨停