人工智能国产化推理算力资源池建设
从计算、网络、存储三方面协同建设集团级 AI 基础设施,实现统一纳管、统一调度和统一服务输出。
国产化推理算力资源池
大型制造业 / 集团级 AI 平台 · 某大型制造业集团 · 2026
某大型制造业集团业务覆盖研发设计、生产制造、质量管理、供应链管理、设备运维和数字化运营等多个环节,集团希望建设统一 AI 基础设施能力。
客户需要新建人工智能国产化推理算力资源池,为总部、下属工厂、业务部门和生产经营系统提供统一、稳定、安全、可调度的推理算力。
资源池需要支持 ChatGLM、Baichuan2、LLaMA 34B、LLaMA2 13B/70B 等多类大模型,并接入集团云管中心和人工智能平台。
Ouryun 如何为「某大型制造业集团」落地国产化推理算力资源池
方案从计算、网络、存储三个方面进行整体设计,构建面向大模型推理场景的高性能国产化 AI 算力资源池。
KUNLUN 计算集群
采用多台 KUNLUN 服务器组成高密 AI 推理算力集群,单台可提供 6P@FP16 算力和 1024G HBM 片上内存。
高速芯片与节点互联
节点内提供 392GB/s 芯片互联带宽,节点间采用 16 × 200GE RoCE 网络互联。
多平面网络设计
业务面、样本面、参数面分离组网,参数面采用 200GE RoCE 无阻塞网络。
Spine-Leaf 与 M-LAG
采用 Spine-Leaf 两层架构和 M-LAG 冗余设计,提升东西向流量承载和网络可靠性。
分布式存储资源池
存储系统兼顾高 I/O 和高带宽访问,承载模型文件、样本数据、推理数据、生产业务数据和平台运行数据。
从接入到落地,四步走完
计算资源池
部署国产化 AI 推理服务器集群,形成集中化算力池。
高速网络
建设业务面、样本面、参数面分离网络,保障低时延高吞吐通信。
存储支撑
部署分布式存储系统,统一承载模型、样本、推理和生产业务数据。
统一纳管
接入混合云管理系统和集团人工智能平台,实现统一纳管、调度和服务输出。
用户简介
某大型制造业集团长期深耕高端制造、智能制造、工业装备、供应链协同和产业服务等领域,业务覆盖研发设计、生产制造、质量管理、供应链管理、设备运维和数字化运营等多个环节。
集团希望建设统一的人工智能基础设施,为总部、下属工厂、事业部、业务系统和行业应用提供稳定、安全、可扩展的 AI 算力支撑。
用户需求
建设统一的国产化 AI 推理算力资源池。
支撑 ChatGLM、Baichuan2、LLaMA 34B、LLaMA2 13B/70B 等多类型大模型推理。
通过集团云管中心混合云管理系统实现云资源统一调度。
接入集团人工智能平台进行统一管理。
满足集团级平台化建设的扩展性、稳定性和可运维要求。
解决方案
计算集群采用多台 KUNLUN 服务器,形成高密 AI 推理算力资源池;单台服务器提供 6P@FP16 算力、1024G HBM 片上内存、392GB/s 芯片互联带宽和 16 × 200GE RoCE 节点间互联。
网络集群对业务面、样本面、参数面进行分离组网,参数面采用 200GE RoCE 无阻塞网络,整体使用 Spine-Leaf 两层架构和 M-LAG 冗余设计。
存储集群采用分布式存储架构,兼顾高 I/O 和高带宽访问,为模型文件、样本数据、推理数据、生产业务数据和平台运行数据提供统一支撑。
用户效益
建设统一的国产化 AI 推理算力资源池。
提供 17.5PFLOPS FP16 AI 算力支持。
支撑多类型大模型运行。
提升集团 AI 资源统一管理能力。
提高算力资源利用效率。
支撑集团人工智能规模化落地。
用数字说明交付价值