随着AI大模型向深度应用演进,算力提供商的盈利逻辑正经历从“拼硬件”到“拼算力吞吐效率”的转变。浪潮信息(000977)通过发布超扩展AI服务器元脑HC1000,采用无损超扩展设计聚合海量本土AI芯片,支持极大推理吞吐量,将推理成本跌破1元/每百万token。这一技术突破直接击穿了高昂的token成本瓶颈,大幅压缩了算力运营支出,为下游大模型应用的规模化落地铺平道路,并深刻重塑了算力提供商的营收与盈利模型。
超扩展架构攻坚推理成本瓶颈
传统算力部署往往面临交互速度慢与单token调用成本高昂的双重制约,直接限制了智能体的产业化进程。为突破这一瓶颈,浪潮信息在超节点与超扩展架构上实现了底层重构。
在节点级算力整合上,元脑SD200运用多主机低延迟内存语义通信架构,单机内实现64路本土AI芯片高速统一互连;在复杂大模型运行测试中,其基于DeepSeekR1大模型的token生成速度仅需7.3毫秒。这种极致的交互效率,配合元脑HC1000的极大推理吞吐量,为算力成本降至1元/每百万token以下提供了坚实的底座支撑。此外,公司的元脑R1推理服务器实现业界首次单机支持16张标准PCIe双宽卡,单机即可部署“满血版”DeepSeek-671B模型,进一步提升单点算力的集约化利用率。
液冷全栈布局与算力工厂重塑盈利
算力提供商盈利模型的重塑不仅依赖算力吞吐量的提升,更在于对总体运营成本(尤其是散热与能耗)的极致把控。浪潮信息已实现从部件、整机到数据中心的全栈液冷布局,并推出兆瓦级两相液冷AI整机柜方案。该方案采用高效相变散热技术,单芯片解热突破3000W,解热能力高达每平方厘米250W以上。
通过提供从规划设计到建设实施的全生命周期整体解决方案,浪潮信息帮助算力运营方大幅提升资金周转与设施落地效率。其投运的元脑算力工厂仅用120天建成10MW规模的智算中心,通过部署高密智算算力仓,使风冷负载上限达50kW、液冷负载上限达130kW,数据中心PUE降至1.1以下,年节约电费近2000万元。PUE的下降与电费的大额节约,直接增厚了算力提供商的利润空间。
常见问题
浪潮信息超扩展服务器如何降低算力成本?
超扩展AI服务器元脑HC1000通过无损超扩展设计聚合海量本土AI芯片,支持极大的推理吞吐量,使推理成本跌破1元/每百万token。同时,依托高效相变液冷技术降低PUE与电费开支,从算力产出与运营能耗双向压降了整体成本。
浪潮信息在液冷服务器市场的布局如何?
浪潮信息已实现从部件、整机到数据中心的全栈液冷布局,并连续四年蝉联中国液冷服务器市场第一。其兆瓦级两相液冷AI整机柜方案的单芯片解热能力已突破3000W,有效满足了高密度算力仓的散热需求。
AI服务器行业面临哪些主要风险?
该领域主要面临AI产业发展不及预期、公司产品推进不及预期,以及行业竞争加剧等风险。算力硬件技术的迭代速度极快,算力提供商需持续投入研发以应对商业模式落地过程中的不确定性。