英伟达张旭:构建企业专属AI工厂,实现算力到服务的价值转化

14

在2025年创新者年会上,英伟达亚太区企业级软件负责人张旭发表了题为《即刻部署,敏捷创新:开启企业专属AI工厂的实践之路》的主题演讲,深入探讨了如何帮助企业实现从算力到企业服务的价值转化。张旭的分享不仅回顾了AI技术的演进历程,更提出了企业专属AI工厂的解决方案,为企业AI落地提供了实用指导。

AI技术的演进与挑战

AI技术的发展经历了多个重要阶段。从最初的感知AI,应用于流媒体处理、视频和语音识别,到三年前ChatGPT的诞生标志着生成式AI时代的到来,再到今天我们正在经历的代理人式AI(智能体)阶段。张旭指出,智能体具有"工作意识",能够调用各种工具完成特定任务,而Physical AI则致力于改变物理世界。

AI技术演进图

英伟达作为加速计算的先驱,从为小米手机提供GPU芯片,到支持特斯拉车载显示、会议智能终端和任天堂Switch游戏机,不断推动计算技术的发展。然而,随着AI应用的深入,数据传输逐渐成为限制因素,为此英伟达发明了NVLink技术取代PCIe,并在2019年收购了以色列的Mellanox,为IDC提供计算和网络解决方案,形成了完整的AIDC参考设计。

企业AI落地的三大痛点

张旭在演讲中指出了企业AI落地过程中面临的三大痛点:

  1. 相关性问题:企业投入大量资金部署AI后,发现Demo与实际业务关联度不高,基础开源模型的准确率(约60-70%)无法满足业务需求。

  2. 准确率问题:经过数据治理和模型迭代,虽然提高了准确率,但第三个问题随之而来。

  3. 成本问题:GPU成本高、模型大、业务需求多、并发高,导致第一个Token生成时间长,整体效果不佳。

这些痛点使得许多企业在AI投资后难以看到实际回报,形成了"投入大、见效慢、难持续"的困境。

企业专属AI工厂的解决方案

针对上述痛点,英伟达提出了企业专属AI工厂的解决方案,重点解决两个核心问题:Token效率和Token业务相关性。

张旭强调:"每一个实体企业,不管是生产产品还是生产服务,都应该有一个基于企业数据的AI工厂来辅助其业务。"这一理念将AI技术比作"硅基劳动力",通过复刻碳基劳动力的进化逻辑,为企业提供全生命周期的AI管理能力。

硅基劳动力的三大规律

英伟达将硅基劳动力的发展总结为三大规律,与碳基劳动力的发展相呼应:

  1. 预训练:相当于基础模型完成了"本科教育",具备了基本能力。
  2. 后训练:相当于"活到老、学到老"的持续学习过程。
  3. 推理:相当于"边学边用"的实际应用阶段。

这三个阶段都在GPU上发生并被GPU加速处理,为企业提供高效的AI能力。

英伟达的技术栈架构

英伟达的技术栈架构分为多个层次:

  1. 硬件层:包括GPU、CPU、网络芯片等,虽然这些芯片不直接流通,但构成了整个技术栈的基础。

  2. 平台层:包括节点、工作栈或机柜等,这些平台是合作伙伴投入巨资拥有的核心资产。

  3. CUDA生态:这是英伟达真正的价值所在,全球近千万开发者利用CUDA生态进行加速计算,涵盖CAD设计、物质发现、3D生成、流体力学仿真和大模型等领域。

然而,张旭指出,掌握加速计算的人才主要分布在互联网大厂、大模型公司和科研机构,企业内部缺乏这类人才。同时,企业不愿意将数据交给第三方,因此英伟达提出了企业服务解决方案:"你不需要把数据给我,我不需要拿你的数据,我把工具给你,你可以用这些工具来构建自己的企业服务。"

核心技术组件

企业专属AI工厂的核心技术组件包括:

  1. 推理微服务:将大模型推理转化为GPU加速的微服务,实现"AI能力的IT化"。通过封装复杂的SDK和中间件,提供标准API,使企业能够在K8环境中部署,降低使用门槛。

  2. NEMO:提供硅基劳动力全生命周期管理工具。从数据准备、培训、评估到行为规范制定,帮助企业高效管理AI能力。NEMO模拟了企业组织架构中的"爱因斯坦"和"外卖小哥"等角色,形成完整的数据飞轮。

  3. Agent操作系统:未来企业的操作系统将由Agent组成,传统的浏览器、ERP、WMS等系统都将转化为Agent形式,实现更智能的企业管理。

全栈解决方案

英伟达通过一系列收购,如以色列的Run.ai和Lepton公司,不断丰富其AI Factory软件栈的能力。这一全栈解决方案包括:

  • IDC层面:解决能源就绪问题,将数据中心设备转化为算力就绪状态。
  • 存储、计算、网络:提供全栈管理软件,优化资源利用。
  • 云原生架构:包括GPU切分、各种operator优化硬件调用,GPU动态管理等。

Physical AI的未来展望

张旭还提到了Physical AI的发展,指出物理世界的具身智能同样会面临"幻觉"问题。英伟达提供的Physical AI stack帮助企业碳基劳动力在不同生产环境中(如化工企业、药品企业或开放道路)遵循自然规律、法律法规和社会规范,确保AI应用的安全性和可靠性。

实践案例与未来方向

英伟达已经与ServiceNow等企业开展了合作实践,同时也在积极推进"China For China"的本土化实践。这些案例展示了如何将GPU资源更有效地转化为企业服务,实现真正的价值转化。

张旭强调,英伟达的目标是帮助企业构建专属的AI工厂,使AI技术不再是实验室的产物,而是能够直接服务于业务的核心竞争力。通过预训练、后训练和推理的全流程支持,企业可以充分利用自身数据,构建符合业务需求的AI能力,实现从算力到服务的价值转化。

结语

在AI技术快速发展的今天,企业如何有效利用AI技术提升竞争力成为关键议题。英伟达提出的企业专属AI工厂解决方案,通过全栈技术支持和硅基劳动力全生命周期管理,为企业提供了从算力到服务的完整转化路径。随着Physical AI等前沿技术的不断发展,我们有理由相信,AI技术将在更多领域实现突破,为企业创造更大价值。