浪潮信息(000977)通过发布超扩展AI服务器元脑HC1000,依托无损超扩展架构设计聚合海量本土AI芯片,在支持极大推理吞吐量的同时,将大模型推理成本压至1元/每百万token以内。这种极致的算力性价比有效解决了智能体产业化面临的成本瓶颈,助力企业构建算力基础设施壁垒。需注意,AI产业存在发展及推进不及预期、行业竞争加剧等风险,本文仅作产业与客观技术解读,不构成任何投资建议。

架构创新:如何破解交互速度与token成本瓶颈?

在智能体产业化推进过程中,高昂的交互成本与算力调度瓶颈是核心痛点。浪潮信息针对这一需求,推出了超节点AI服务器元脑SD200与超扩展AI服务器元脑HC1000。

在底层算力互联上,元脑SD200运用多主机低延迟内存语义通信架构,单机内实现64路本土AI芯片高速统一互连。基于DeepSeekR1大模型的测试,其token生成速度仅需7.3毫秒。这种高速互连能力为上层超扩展架构奠定了基础。元脑HC1000则进一步采用无损超扩展设计,通过聚合海量本土AI芯片,有效支撑了庞大的并发算力需求,从而在系统级突破了交互速度限制。

极致推理成本的底层技术逻辑

元脑HC1000之所以能将推理成本控制在极低水平,核心在于其无损超扩展架构对海量芯片算力的高效池化与调度。该架构支持极大的推理吞吐量,通过规模效应大幅摊薄了单次计算的边际成本,最终实现推理成本跌破1元/每百万token。

此外,高密度的算力聚合离不开高效的散热支撑。浪潮信息已实现从部件、整机到数据中心的全栈液冷布局,并推出兆瓦级两相液冷AI整机柜方案。该方案采用高效相变散热技术,单芯片解热突破3000W,解热能力高达每平方厘米250W以上。这种散热能力不仅保障了超扩展架构下芯片的稳定满载运行,也实质性降低了数据中心的整体能耗与运营成本。

常见问题

浪潮信息在AI服务器领域的主要产品布局有哪些?

公司主营服务器产品,近期重点推出了元脑R1推理服务器(单机支持16张标准PCIe双宽卡并单机部署“满血版”DeepSeek-671B模型),以及针对智能体算力瓶颈的元脑SD200与元脑HC1000,覆盖从单机推理到超扩展架构的多元需求。

元脑HC1000是如何降低大模型推理成本的?

该产品采用无损超扩展设计,通过聚合海量本土AI芯片并支持极大的推理吞吐量,发挥规模聚合优势,将大模型的推理成本压降至1元/每百万token以内。

该公司的液冷与智算中心交付能力如何?

公司已连续四年蝉联中国液冷服务器市场第一。其投运的元脑算力工厂能够在120天内建成10MW规模的智算中心,通过部署高密智算算力仓将数据中心PUE降至1.1以下,实现年节约电费近2000万元。

延伸阅读