AI狂奔不止：世界模型与智能体如何重塑物理与数字边界？

2026-06-13 13:50 0 阅读

人工智能的发展轨迹正在改写我们的认知框架。回顾2016年，深度学习爆发后迅速进入平台期，而到了2026年，距离大模型技术全面爆发已过去整整四年，其增长曲线依然陡峭，未见明显触顶迹象。在刚刚结束的智源大会2026上，一个核心共识变得清晰：AI不再仅仅是优化现有流程的工具，它正在成为重构世界的底层力量。这种重构不仅体现在数字内容生成的效率提升，更在于其向物理世界渗透的能力——从代码编写到机器人操作，智能的边界正在被不断延展。

光锥智能

Scaling Law未失效：数据与算力的新范式

过去一年内，行业内曾弥漫着一种焦虑情绪，认为高质量互联网文本数据即将耗尽，Scaling Law（缩放定律）的红利正在枯竭。然而，智源大会上的多项最新进展直接否定了这一悲观论调。银河通用创始人兼CTO王鹤指出，Scaling Law并未失效，只是其表现形式变得更加多样化。

这种多样化体现在参数规模、合成数据与强化学习的三维联动上。以Anthropic近期发布的Fable 5模型为例，小米集团高级副总裁罗福莉在分析中指出，这是科学推进Scaling的直接产物。该模型不仅在参数量上远超当前主流开源模型，更在推理时扩展（Test-Time Scanning）和强化学习投入了巨大算力。更为关键的是，由人类专家与智能体（Agent）共同生成的合成数据，将数据规模推向了全新量级。这意味着，单纯依赖人类标注数据的时代正在结束，人机协同的数据生产线正在成为主流。

Scaling Law

多模态领域的进展同样印证了这一趋势。生数科技创始人兼首席科学家朱军强调，数据质量、模型尺寸与大规模训练的协同效应，正在赋予模型更高效的物理规律学习能力。基础模型能力的跃升，使得AI对3D场景的理解从简单的识别走向深层的逻辑推理。与此同时，AI Coding技术的成熟标志着数字世界底层架构的接管。王仲远院长提到，由于数字世界的基石是代码，AI Coding的实质性突破意味着AI将逐步接管数字世界的构建与维护，从写代码升级为自动迭代产品版本，这一过程本身就是AI自进化的重要体现。

世界模型：大模型的下一个关键战场

沿着数字世界的边界向外突围，世界模型（World Models）已成为大模型下一阶段的核心焦点。智源研究院院长王仲远坦言，目前尚无哪一款世界模型能完全惊艳地解决真实物理世界的复杂问题，技术路线尚未收敛，数据路径仍存在争议。

世界模型分类

智源研究院将世界模型划分为四类主要技术路线：以语言为中心的世界模型（如VLM、VLA），将多模态信息映射至语言空间；以像素为中心的世界模型（如WAM），本质上是预测下一帧画面；以三维结构为中心的世界模型，专注于3D重建；以及以视觉表征为轴心的模型。此外，智源正在探索第五类路径——潜空间表征。通过将文本、图像等信息压缩至统一的向量空间中，构建全模态潜空间，这可能是未来世界模型统一形态的关键。

悟界模型

在数据策略上，合成数据的作用日益凸显。银河通用在WAM范式出现前，利用仿真数据进行了大量尝试。王鹤介绍，通过10亿帧的仿真数据训练，实现了抓取任务的零样本学习（Zero-shot）。这证明了只要将合成数据规模化，AI即可在真实世界中泛化操作。智源研究院研发的“悟界·Physis-v0.1”版本，定位为全球首个通用世界基座模型，强调物理正确性、动作因果可溯、长时序一致及通用泛化四大能力。该模型目前处于训练阶段，预计下半年将开源，标志着行业在物理空间建模上迈出了实质性一步。

智能体从“可用”到“好用”的工程跨越

如果说世界模型是AI理解物理世界的眼睛，那么智能体（Agent）就是其双手。2025年被视为“智能体元年”，而2026年的智能体已展现出更强的主动性与任务执行能力。智源大会现场发布了多款垂类智能体，包括面向心脏磁共振诊断的BAAI Cardiac Agent、辅助科研的AREX、实时会议总结的SoulAgent等。

SoulAgent

在实际测试中，SoulAgent能够准确捕捉会议核心观点，虽不及人工纪要详尽，但在应对多分会场并行场景时表现出高实用性。然而，从“可用”迈向“好用”，智能体仍面临工程化挑战。南洋理工大学校长讲席教授安洋指出，上下文工程中的记忆（Memory）与编排（Orchestration）是提升智能体能力的关键。

在这一过程中，Harness（智能体工程化框架）成为高频关键词。李景秋指出，模型决定了智能体的能力上限，而Harness决定了实际执行效率。Harness需要完成意图理解、任务流程设计、模型调度以及结果验证与反馈。这要求产品团队像打磨真人助理一样，对每一个执行细节进行优化与纠偏。目前，智能体行业仍处于初期阶段，无论是模型能力的提升还是工程细节的夯实，都蕴含着巨大的进步空间。

算力底座：芯片厂商的“半壁江山”

AI从数字世界跑进物理世界，离不开底层算力的支撑。在智源大会的展台现场，芯片厂商占据了“半壁江山”，几乎涵盖了所有头部的国产AI芯片企业。这反映了行业对软硬件协同的高度重视。随着Agent在医疗、科研等复杂场景的应用深化，对算力的需求不仅在于规模，更在于能效比与实时处理能力。国产芯片的全面入场，为AI自主可控与持续迭代提供了坚实的硬件基础。

综上所述，2026年的AI行业正处于从“会聊天”向“会干活”转型的关键节点。Scaling Law在合成数据与新范式下的持续生效，世界模型对物理规律的多维度建模，以及智能体工程化框架的成熟，共同推动了AI向物理世界的渗透。尽管技术路线尚未完全收敛，但这一进程已不可逆转，智能正从一种工具演变为重构现实世界的基础设施。