← 案例2026某大型制造业集团国产化推理算力资源池

人工智能国产化推理算力资源池建设

从计算、网络、存储三方面协同建设集团级 AI 基础设施，实现统一纳管、统一调度和统一服务输出。

大型制造业 / 集团级 AI 平台国产化算力

建设背景

国产化推理算力资源池

大型制造业 / 集团级 AI 平台 · 某大型制造业集团 · 2026

某大型制造业集团业务覆盖研发设计、生产制造、质量管理、供应链管理、设备运维和数字化运营等多个环节，集团希望建设统一 AI 基础设施能力。

客户需要新建人工智能国产化推理算力资源池，为总部、下属工厂、业务部门和生产经营系统提供统一、稳定、安全、可调度的推理算力。

资源池需要支持 ChatGLM、Baichuan2、LLaMA 34B、LLaMA2 13B/70B 等多类大模型，并接入集团云管中心和人工智能平台。

解决方案

Ouryun 如何为「某大型制造业集团」落地国产化推理算力资源池

方案从计算、网络、存储三个方面进行整体设计，构建面向大模型推理场景的高性能国产化 AI 算力资源池。

KUNLUN 计算集群

采用多台 KUNLUN 服务器组成高密 AI 推理算力集群，单台可提供 6P@FP16 算力和 1024G HBM 片上内存。

↗

高速芯片与节点互联

节点内提供 392GB/s 芯片互联带宽，节点间采用 16 × 200GE RoCE 网络互联。

↗

多平面网络设计

业务面、样本面、参数面分离组网，参数面采用 200GE RoCE 无阻塞网络。

↗

Spine-Leaf 与 M-LAG

采用 Spine-Leaf 两层架构和 M-LAG 冗余设计，提升东西向流量承载和网络可靠性。

↗

分布式存储资源池

存储系统兼顾高 I/O 和高带宽访问，承载模型文件、样本数据、推理数据、生产业务数据和平台运行数据。

↗

落地路径

从接入到落地，四步走完

计算资源池

部署国产化 AI 推理服务器集群，形成集中化算力池。

↗

高速网络

建设业务面、样本面、参数面分离网络，保障低时延高吞吐通信。

↗

存储支撑

部署分布式存储系统，统一承载模型、样本、推理和生产业务数据。

↗

统一纳管

接入混合云管理系统和集团人工智能平台，实现统一纳管、调度和服务输出。

↗

完整项目记录

用户简介

某大型制造业集团长期深耕高端制造、智能制造、工业装备、供应链协同和产业服务等领域，业务覆盖研发设计、生产制造、质量管理、供应链管理、设备运维和数字化运营等多个环节。

集团希望建设统一的人工智能基础设施，为总部、下属工厂、事业部、业务系统和行业应用提供稳定、安全、可扩展的 AI 算力支撑。

用户需求

建设统一的国产化 AI 推理算力资源池。

支撑 ChatGLM、Baichuan2、LLaMA 34B、LLaMA2 13B/70B 等多类型大模型推理。

通过集团云管中心混合云管理系统实现云资源统一调度。

接入集团人工智能平台进行统一管理。

满足集团级平台化建设的扩展性、稳定性和可运维要求。

解决方案

计算集群采用多台 KUNLUN 服务器，形成高密 AI 推理算力资源池；单台服务器提供 6P@FP16 算力、1024G HBM 片上内存、392GB/s 芯片互联带宽和 16 × 200GE RoCE 节点间互联。

网络集群对业务面、样本面、参数面进行分离组网，参数面采用 200GE RoCE 无阻塞网络，整体使用 Spine-Leaf 两层架构和 M-LAG 冗余设计。

存储集群采用分布式存储架构，兼顾高 I/O 和高带宽访问，为模型文件、样本数据、推理数据、生产业务数据和平台运行数据提供统一支撑。

用户效益

建设统一的国产化 AI 推理算力资源池。

提供 17.5PFLOPS FP16 AI 算力支持。

支撑多类型大模型运行。

提升集团 AI 资源统一管理能力。

提高算力资源利用效率。

支撑集团人工智能规模化落地。

用户效益

用数字说明交付价值

0PFLOPS

FP16 AI 算力支持

0GE

RoCE 参数面网络

单节点 HBM 片上内存

统一调度

集团 AI 资源池纳管

国产化推理算力资源池

把这套能力，接进你的业务

关键能力KUNLUN 计算集群高速芯片与节点互联多平面网络设计Spine-Leaf 与 M-LAG

获取企业 AI 落地方案→

更多案例

其他 Ouryun 落地案例

查看全部案例 →

制造业 AI 质检项目

在 PCB 生产 AOI 初检基础上，引入 AOI + AI 智能降点解决方案一体机，对 NG 图片进行 AI 二次复判，降低人工复判压力。

查看案例→

DeepSeek 本地化算力基座建设

为科技企业建设 6 节点 48 卡 GPU 集群，部署 DeepSeek-R1 671B 满血版，并同步规划 API 发布、AI 安全治理和大模型安全测评。

查看案例→

OURYUN · 接入 · 管控 · 部署 · 落地 ·