曙光6万卡AI4S集群投用:中国科学智能算力新里程碑

0

曙光6万卡AI4S集群的技术突破

2025年4月,中科曙光在郑州国家超算互联网核心节点实现重大技术突破——国内最大规模6万卡AI4S计算集群系统正式投入使用。这一成就不仅刷新了国内计算集群工程化部署的纪录,更标志着我国在人工智能驱动科学研究领域实现全栈技术跨越。

曙光AI4S计算集群架构图

AI4S成为科技竞争新焦点

近年来,AI for Science逐渐成为全球科技竞争的焦点领域。与通用人工智能不同,AI4S向硬核科研领域深度渗透,正在重塑知识生产方式,推动科研范式变革。业内专家指出,AI4S已展现出突破传统科研效率瓶颈的显著优势,在生物制药、新材料、半导体设计等高价值领域具有广泛应用前景。

六大技术特征解析

强大算力基础

曙光AI4S计算集群实现6万卡集群部署,提供全球顶级的超智融合算力。这种规模的计算资源为复杂科学问题的求解提供了前所未有的计算能力支撑。

全精度计算能力

依托自主可控核心芯片,集群支持8/16/32/64位宽的全精度计算,能够高效处理高维函数和复杂科学问题。这种灵活性使得集群能够适应不同学科领域的计算需求。

高速互连网络

通过国内首款类InfiniBand无损高速网络scaleFabric系列产品,集群充分满足AI4S计算对高带宽、低时延网络的极致需求。这种网络架构确保了大规模并行计算的高效性。

存算协同设计

集群采用"超级隧道"和AI数据加速等创新设计,实现从芯片、系统到应用的三层传输协同,有效避免了存储IO瓶颈问题。

灵活调度机制

智能调度机制使系统能够根据任务需求灵活匹配、调度集群的计算存储网络等资源,并发作业调度效率达到每秒万次级别。

稳定可靠运行

依托智能化运维、数字孪生系统以及浸没相变液冷技术,系统可用性达到99.99%,保障集群长周期稳定运行。

实际应用成效显著

在测试应用阶段,曙光AI4S计算集群已展现出卓越的性能表现。在生物科学领域,3万卡规模的蛋白质折叠模拟较传统算法加速1000倍;在材料科学方面,4.5万卡规模实现万亿原子液态水分子动力学模拟,打破世界模拟规模纪录的同时让效率提升3个数量级以上。

集群应用场景示意图

降低科学智能开发门槛

值得一提的是,集群搭载的OneScience平台极大地降低了AI4S模型开发的门槛。该平台集成数十个AI4S热点模型及数据集,覆盖地球科学、生物信息、流体仿真、材料化学等多学科领域,使用户能够在数小时内完成科学大模型开发。

产业生态建设

随着6万卡AI4S计算集群的落地,国家超算互联网平台已构建起国内规模最大的AI4S计算基础设施,总计链接超300万CPU核和超20万GPU卡。这一基础设施接入全国一体化算网调度体系,为全国高校、科研院所和企业提供普惠化AI4S算力服务。

技术发展历程

从2025年12月发布scaleX万卡超集群,到2026年2月3万卡上线国家超算互联网核心节点,再到此次6万卡AI4S计算集群系统,中科曙光在计算集群工程化部署方面持续实现技术突破。这种快速迭代的发展态势,充分体现了我国在高端计算领域的技术积累和创新能力。

未来展望

业内专家认为,AI4S产业的发展将为我国科技创新提供强大动力。随着计算资源的不断丰富和算法的持续优化,AI4S有望在更多科学领域发挥重要作用,推动我国在前沿科技领域实现更大突破。中科曙光等企业的持续技术创新,将为我国人工智能产业发展提供坚实支撑。

总结

曙光6万卡AI4S计算集群的成功投用,是我国在科学智能计算领域的重要里程碑。这一成就不仅展示了我国在高端计算技术方面的实力,更为后续的科学研究和技术创新提供了强大的基础设施支持。随着AI4S技术的不断发展和应用,我们有理由期待在更多科学领域看到突破性进展。