超扩展AI服务器推理成本跌破一元每百万token，浪潮信息（000977）如何靠架构创新锁定大客户？

Q: "浪潮信息在AI服务器领域的主要产品布局有哪些？"

"公司主营服务器产品，近期重点推出了元脑R1推理服务器（单机支持16张标准PCIe双宽卡并单机部署“满血版”DeepSeek-671B模型），以及针对智能体算力瓶颈的元脑SD200与元脑HC1000，覆盖从单机推理到超扩展架构的多元需求。"

Q: "元脑HC1000是如何降低大模型推理成本的？"

"该产品采用无损超扩展设计，通过聚合海量本土AI芯片并支持极大的推理吞吐量，发挥规模聚合优势，将大模型的推理成本压降至1元/每百万token以内。"

Q: "该公司的液冷与智算中心交付能力如何？"

"公司已连续四年蝉联中国液冷服务器市场第一。其投运的元脑算力工厂能够在120天内建成10MW规模的智算中心，通过部署高密智算算力仓将数据中心PUE降至1.1以下，实现年节约电费近2000万元。"

浪潮信息（000977）通过发布超扩展AI服务器元脑HC1000，依托无损超扩展架构设计聚合海量本土AI芯片，在支持极大推理吞吐量的同时，将大模型推理成本压至1元/每百万token以内。这种极致的算力性价比有效解决了智能体产业化面临的成本瓶颈，助力企业构建算力基础设施壁垒。需注意，AI产业存在发展及推进不及预期、行业竞争加剧等风险，本文仅作产业与客观技术解读，不构成任何投资建议。

架构创新：如何破解交互速度与token成本瓶颈？

在智能体产业化推进过程中，高昂的交互成本与算力调度瓶颈是核心痛点。浪潮信息针对这一需求，推出了超节点AI服务器元脑SD200与超扩展AI服务器元脑HC1000。

在底层算力互联上，元脑SD200运用多主机低延迟内存语义通信架构，单机内实现64路本土AI芯片高速统一互连。基于DeepSeekR1大模型的测试，其token生成速度仅需7.3毫秒。这种高速互连能力为上层超扩展架构奠定了基础。元脑HC1000则进一步采用无损超扩展设计，通过聚合海量本土AI芯片，有效支撑了庞大的并发算力需求，从而在系统级突破了交互速度限制。

极致推理成本的底层技术逻辑

元脑HC1000之所以能将推理成本控制在极低水平，核心在于其无损超扩展架构对海量芯片算力的高效池化与调度。该架构支持极大的推理吞吐量，通过规模效应大幅摊薄了单次计算的边际成本，最终实现推理成本跌破1元/每百万token。

此外，高密度的算力聚合离不开高效的散热支撑。浪潮信息已实现从部件、整机到数据中心的全栈液冷布局，并推出兆瓦级两相液冷AI整机柜方案。该方案采用高效相变散热技术，单芯片解热突破3000W，解热能力高达每平方厘米250W以上。这种散热能力不仅保障了超扩展架构下芯片的稳定满载运行，也实质性降低了数据中心的整体能耗与运营成本。

常见问题

浪潮信息在AI服务器领域的主要产品布局有哪些？

公司主营服务器产品，近期重点推出了元脑R1推理服务器（单机支持16张标准PCIe双宽卡并单机部署“满血版”DeepSeek-671B模型），以及针对智能体算力瓶颈的元脑SD200与元脑HC1000，覆盖从单机推理到超扩展架构的多元需求。

元脑HC1000是如何降低大模型推理成本的？

该产品采用无损超扩展设计，通过聚合海量本土AI芯片并支持极大的推理吞吐量，发挥规模聚合优势，将大模型的推理成本压降至1元/每百万token以内。

该公司的液冷与智算中心交付能力如何？

公司已连续四年蝉联中国液冷服务器市场第一。其投运的元脑算力工厂能够在120天内建成10MW规模的智算中心，通过部署高密智算算力仓将数据中心PUE降至1.1以下，实现年节约电费近2000万元。

架构创新：如何破解交互速度与token成本瓶颈？#

极致推理成本的底层技术逻辑#

常见问题#

浪潮信息在AI服务器领域的主要产品布局有哪些？#

元脑HC1000是如何降低大模型推理成本的？#

该公司的液冷与智算中心交付能力如何？#

延伸阅读#