5月21日消息,投行Evercore ISI发布的最新AI渠道调研报告揭示,一线AI工程师对英伟达GPU的评估标准正经历深刻转变。随着功耗与散热成本急剧攀升,超大规模数据中心正加速向自研定制ASIC及替代加速器迁移。报告预测,到2028年,英伟达在AI推理市场的份额或将下滑至50%。
目前,AI行业95%的工作负载已被推理需求占据。在此背景下,工程师的芯片采购标准已从一味追求最大吞吐量和带宽,全面转向考量每代币成本(Cost per Token)、投资回报率(ROI)、电力消耗、散热效率及整体利用率等“算力经济学”指标。
尽管摩根士丹利此前的报告指出,建造英伟达Blackwell GPU数据中心的成本高达定制AI芯片的两倍,但其每瓦性能仍具有最高八倍的优势。然而,这种纯性能的领先已不足以打动一线工程师。一方面,英伟达此前宣称的35倍性能提升饱受行业质疑;另一方面,其高达70%的毛利率被普遍认为过高,严重拖累了客户的整体经济效益。
为追求更优的投入产出比,工程师们更倾向于选择ASIC或其他“足够好”的替代方案。当前,AMD、谷歌TPU、亚马逊云科技Trainium、微软Azure Maia以及各类SRAM芯片的性能正持续跃升。基础设施供应商Nebius的专家也证实,以Groq为代表的加速器因能提供更高通量,正在成为企业降本增效的新选择。


微信扫一扫
支付宝扫一扫 