在2025年创新者年会上,英伟达亚太区企业级软件负责人张旭发表了题为《即刻部署,敏捷创新:开启企业专属AI工厂的实践之路》的主题演讲,深入探讨了如何帮助企业实现从算力到企业服务的价值转化。张旭的分享不仅回顾了AI技术的演进历程,更提出了企业专属AI工厂的解决方案,为企业AI落地提供了实用指导。
AI技术的演进与挑战
AI技术的发展经历了多个重要阶段。从最初的感知AI,应用于流媒体处理、视频和语音识别,到三年前ChatGPT的诞生标志着生成式AI时代的到来,再到今天我们正在经历的代理人式AI(智能体)阶段。张旭指出,智能体具有"工作意识",能够调用各种工具完成特定任务,而Physical AI则致力于改变物理世界。

英伟达作为加速计算的先驱,从为小米手机提供GPU芯片,到支持特斯拉车载显示、会议智能终端和任天堂Switch游戏机,不断推动计算技术的发展。然而,随着AI应用的深入,数据传输逐渐成为限制因素,为此英伟达发明了NVLink技术取代PCIe,并在2019年收购了以色列的Mellanox,为IDC提供计算和网络解决方案,形成了完整的AIDC参考设计。
企业AI落地的三大痛点
张旭在演讲中指出了企业AI落地过程中面临的三大痛点:
相关性问题:企业投入大量资金部署AI后,发现Demo与实际业务关联度不高,基础开源模型的准确率(约60-70%)无法满足业务需求。
准确率问题:经过数据治理和模型迭代,虽然提高了准确率,但第三个问题随之而来。
成本问题:GPU成本高、模型大、业务需求多、并发高,导致第一个Token生成时间长,整体效果不佳。
这些痛点使得许多企业在AI投资后难以看到实际回报,形成了"投入大、见效慢、难持续"的困境。
企业专属AI工厂的解决方案
针对上述痛点,英伟达提出了企业专属AI工厂的解决方案,重点解决两个核心问题:Token效率和Token业务相关性。
张旭强调:"每一个实体企业,不管是生产产品还是生产服务,都应该有一个基于企业数据的AI工厂来辅助其业务。"这一理念将AI技术比作"硅基劳动力",通过复刻碳基劳动力的进化逻辑,为企业提供全生命周期的AI管理能力。
硅基劳动力的三大规律
英伟达将硅基劳动力的发展总结为三大规律,与碳基劳动力的发展相呼应:
- 预训练:相当于基础模型完成了"本科教育",具备了基本能力。
- 后训练:相当于"活到老、学到老"的持续学习过程。
- 推理:相当于"边学边用"的实际应用阶段。
这三个阶段都在GPU上发生并被GPU加速处理,为企业提供高效的AI能力。
英伟达的技术栈架构
英伟达的技术栈架构分为多个层次:
硬件层:包括GPU、CPU、网络芯片等,虽然这些芯片不直接流通,但构成了整个技术栈的基础。
平台层:包括节点、工作栈或机柜等,这些平台是合作伙伴投入巨资拥有的核心资产。
CUDA生态:这是英伟达真正的价值所在,全球近千万开发者利用CUDA生态进行加速计算,涵盖CAD设计、物质发现、3D生成、流体力学仿真和大模型等领域。
然而,张旭指出,掌握加速计算的人才主要分布在互联网大厂、大模型公司和科研机构,企业内部缺乏这类人才。同时,企业不愿意将数据交给第三方,因此英伟达提出了企业服务解决方案:"你不需要把数据给我,我不需要拿你的数据,我把工具给你,你可以用这些工具来构建自己的企业服务。"
核心技术组件
企业专属AI工厂的核心技术组件包括:
推理微服务:将大模型推理转化为GPU加速的微服务,实现"AI能力的IT化"。通过封装复杂的SDK和中间件,提供标准API,使企业能够在K8环境中部署,降低使用门槛。
NEMO:提供硅基劳动力全生命周期管理工具。从数据准备、培训、评估到行为规范制定,帮助企业高效管理AI能力。NEMO模拟了企业组织架构中的"爱因斯坦"和"外卖小哥"等角色,形成完整的数据飞轮。
Agent操作系统:未来企业的操作系统将由Agent组成,传统的浏览器、ERP、WMS等系统都将转化为Agent形式,实现更智能的企业管理。
全栈解决方案
英伟达通过一系列收购,如以色列的Run.ai和Lepton公司,不断丰富其AI Factory软件栈的能力。这一全栈解决方案包括:
- IDC层面:解决能源就绪问题,将数据中心设备转化为算力就绪状态。
- 存储、计算、网络:提供全栈管理软件,优化资源利用。
- 云原生架构:包括GPU切分、各种operator优化硬件调用,GPU动态管理等。
Physical AI的未来展望
张旭还提到了Physical AI的发展,指出物理世界的具身智能同样会面临"幻觉"问题。英伟达提供的Physical AI stack帮助企业碳基劳动力在不同生产环境中(如化工企业、药品企业或开放道路)遵循自然规律、法律法规和社会规范,确保AI应用的安全性和可靠性。
实践案例与未来方向
英伟达已经与ServiceNow等企业开展了合作实践,同时也在积极推进"China For China"的本土化实践。这些案例展示了如何将GPU资源更有效地转化为企业服务,实现真正的价值转化。
张旭强调,英伟达的目标是帮助企业构建专属的AI工厂,使AI技术不再是实验室的产物,而是能够直接服务于业务的核心竞争力。通过预训练、后训练和推理的全流程支持,企业可以充分利用自身数据,构建符合业务需求的AI能力,实现从算力到服务的价值转化。
结语
在AI技术快速发展的今天,企业如何有效利用AI技术提升竞争力成为关键议题。英伟达提出的企业专属AI工厂解决方案,通过全栈技术支持和硅基劳动力全生命周期管理,为企业提供了从算力到服务的完整转化路径。随着Physical AI等前沿技术的不断发展,我们有理由相信,AI技术将在更多领域实现突破,为企业创造更大价值。












