案例2026某大型制造业集团国产化推理算力资源池

人工智能国产化推理算力资源池建设

从计算、网络、存储三方面协同建设集团级 AI 基础设施,实现统一纳管、统一调度和统一服务输出。

大型制造业 / 集团级 AI 平台国产化算力
人工智能国产化推理算力资源池建设
建设背景

国产化推理算力资源池

大型制造业 / 集团级 AI 平台 · 某大型制造业集团 · 2026

某大型制造业集团业务覆盖研发设计、生产制造、质量管理、供应链管理、设备运维和数字化运营等多个环节,集团希望建设统一 AI 基础设施能力。

客户需要新建人工智能国产化推理算力资源池,为总部、下属工厂、业务部门和生产经营系统提供统一、稳定、安全、可调度的推理算力。

资源池需要支持 ChatGLM、Baichuan2、LLaMA 34B、LLaMA2 13B/70B 等多类大模型,并接入集团云管中心和人工智能平台。

落地路径

从接入到落地,四步走完

01

计算资源池

部署国产化 AI 推理服务器集群,形成集中化算力池。

02

高速网络

建设业务面、样本面、参数面分离网络,保障低时延高吞吐通信。

03

存储支撑

部署分布式存储系统,统一承载模型、样本、推理和生产业务数据。

04

统一纳管

接入混合云管理系统和集团人工智能平台,实现统一纳管、调度和服务输出。

完整项目记录
01

用户简介

某大型制造业集团长期深耕高端制造、智能制造、工业装备、供应链协同和产业服务等领域,业务覆盖研发设计、生产制造、质量管理、供应链管理、设备运维和数字化运营等多个环节。

集团希望建设统一的人工智能基础设施,为总部、下属工厂、事业部、业务系统和行业应用提供稳定、安全、可扩展的 AI 算力支撑。

02

用户需求

01

建设统一的国产化 AI 推理算力资源池。

02

支撑 ChatGLM、Baichuan2、LLaMA 34B、LLaMA2 13B/70B 等多类型大模型推理。

03

通过集团云管中心混合云管理系统实现云资源统一调度。

04

接入集团人工智能平台进行统一管理。

05

满足集团级平台化建设的扩展性、稳定性和可运维要求。

03

解决方案

01

计算集群采用多台 KUNLUN 服务器,形成高密 AI 推理算力资源池;单台服务器提供 6P@FP16 算力、1024G HBM 片上内存、392GB/s 芯片互联带宽和 16 × 200GE RoCE 节点间互联。

02

网络集群对业务面、样本面、参数面进行分离组网,参数面采用 200GE RoCE 无阻塞网络,整体使用 Spine-Leaf 两层架构和 M-LAG 冗余设计。

03

存储集群采用分布式存储架构,兼顾高 I/O 和高带宽访问,为模型文件、样本数据、推理数据、生产业务数据和平台运行数据提供统一支撑。

04

用户效益

01

建设统一的国产化 AI 推理算力资源池。

02

提供 17.5PFLOPS FP16 AI 算力支持。

03

支撑多类型大模型运行。

04

提升集团 AI 资源统一管理能力。

05

提高算力资源利用效率。

06

支撑集团人工智能规模化落地。

用户效益

用数字说明交付价值

0PFLOPS
FP16 AI 算力支持
0GE
RoCE 参数面网络
0G
单节点 HBM 片上内存
统一调度
集团 AI 资源池纳管
国产化推理算力资源池

把这套能力,接进你的业务

关键能力KUNLUN 计算集群高速芯片与节点互联多平面网络设计Spine-Leaf 与 M-LAG
OURYUN · 接入 · 管控 · 部署 · 落地 ·