GPU耗时反低于CPU数据流水线,RAG架构下的“找排送”为何制约了AI效率?

在RAG场景中,CPU的数据检索与搬运耗时已超越GPU推理,成为决定企业AI问答效率的核心瓶颈。

2026年06月01日 11:36 · 3 分钟 · 1033 字