AI推理成本跌破1元/百万token，浪潮信息（000977）的超扩展服务器如何重塑算力商业模式？

Q: "浪潮信息超扩展服务器如何降低算力成本？"

"超扩展AI服务器元脑HC1000通过无损超扩展设计聚合海量本土AI芯片，支持极大的推理吞吐量，使推理成本跌破1元/每百万token。同时，依托高效相变液冷技术降低PUE与电费开支，从算力产出与运营能耗双向压降了整体成本。"

Q: "浪潮信息在液冷服务器市场的布局如何？"

"浪潮信息已实现从部件、整机到数据中心的全栈液冷布局，并连续四年蝉联中国液冷服务器市场第一。其兆瓦级两相液冷AI整机柜方案的单芯片解热能力已突破3000W，有效满足了高密度算力仓的散热需求。"

Q: "AI服务器行业面临哪些主要风险？"

"该领域主要面临AI产业发展不及预期、公司产品推进不及预期，以及行业竞争加剧等风险。算力硬件技术的迭代速度极快，算力提供商需持续投入研发以应对商业模式落地过程中的不确定性。"

随着AI大模型向深度应用演进，算力提供商的盈利逻辑正经历从“拼硬件”到“拼算力吞吐效率”的转变。浪潮信息（000977）通过发布超扩展AI服务器元脑HC1000，采用无损超扩展设计聚合海量本土AI芯片，支持极大推理吞吐量，将推理成本跌破1元/每百万token。这一技术突破直接击穿了高昂的token成本瓶颈，大幅压缩了算力运营支出，为下游大模型应用的规模化落地铺平道路，并深刻重塑了算力提供商的营收与盈利模型。

超扩展架构攻坚推理成本瓶颈

传统算力部署往往面临交互速度慢与单token调用成本高昂的双重制约，直接限制了智能体的产业化进程。为突破这一瓶颈，浪潮信息在超节点与超扩展架构上实现了底层重构。

在节点级算力整合上，元脑SD200运用多主机低延迟内存语义通信架构，单机内实现64路本土AI芯片高速统一互连；在复杂大模型运行测试中，其基于DeepSeekR1大模型的token生成速度仅需7.3毫秒。这种极致的交互效率，配合元脑HC1000的极大推理吞吐量，为算力成本降至1元/每百万token以下提供了坚实的底座支撑。此外，公司的元脑R1推理服务器实现业界首次单机支持16张标准PCIe双宽卡，单机即可部署“满血版”DeepSeek-671B模型，进一步提升单点算力的集约化利用率。

液冷全栈布局与算力工厂重塑盈利

算力提供商盈利模型的重塑不仅依赖算力吞吐量的提升，更在于对总体运营成本（尤其是散热与能耗）的极致把控。浪潮信息已实现从部件、整机到数据中心的全栈液冷布局，并推出兆瓦级两相液冷AI整机柜方案。该方案采用高效相变散热技术，单芯片解热突破3000W，解热能力高达每平方厘米250W以上。

通过提供从规划设计到建设实施的全生命周期整体解决方案，浪潮信息帮助算力运营方大幅提升资金周转与设施落地效率。其投运的元脑算力工厂仅用120天建成10MW规模的智算中心，通过部署高密智算算力仓，使风冷负载上限达50kW、液冷负载上限达130kW，数据中心PUE降至1.1以下，年节约电费近2000万元。PUE的下降与电费的大额节约，直接增厚了算力提供商的利润空间。

常见问题

浪潮信息超扩展服务器如何降低算力成本？

超扩展AI服务器元脑HC1000通过无损超扩展设计聚合海量本土AI芯片，支持极大的推理吞吐量，使推理成本跌破1元/每百万token。同时，依托高效相变液冷技术降低PUE与电费开支，从算力产出与运营能耗双向压降了整体成本。

浪潮信息在液冷服务器市场的布局如何？

浪潮信息已实现从部件、整机到数据中心的全栈液冷布局，并连续四年蝉联中国液冷服务器市场第一。其兆瓦级两相液冷AI整机柜方案的单芯片解热能力已突破3000W，有效满足了高密度算力仓的散热需求。

AI服务器行业面临哪些主要风险？

该领域主要面临AI产业发展不及预期、公司产品推进不及预期，以及行业竞争加剧等风险。算力硬件技术的迭代速度极快，算力提供商需持续投入研发以应对商业模式落地过程中的不确定性。

超扩展架构攻坚推理成本瓶颈#

液冷全栈布局与算力工厂重塑盈利#

常见问题#

浪潮信息超扩展服务器如何降低算力成本？#

浪潮信息在液冷服务器市场的布局如何？#

AI服务器行业面临哪些主要风险？#

延伸阅读#