陈彬:仿真智能计算+“无仿真、不智能——可计算世界模型”
2026-05-08 作者:

 

图1世界模型的初始理解

 

引言:“世界模型(World Model)”的概念,源于强化学习等以智能体为核心的研究领域,旨在为智能体构建一个关于外部环境如何运作的内部表征。然而,与“具身智能”这个概念在机器人领域的研究中尴尬的状态一致,从建模与仿真学科的视角审视,“世界模型”的作用仅限于支撑该智能体决策的有限上下文,构建智能体所能感知到的世界的样子。参照卡尔波普尔三个世界理论,“世界模型”属于物化的人工世界。但是在深度学习之前,这一模型仅映射物理世界的结构。而随着大模型、具身智能与生成式AI的兴起,“世界模型”必须同时映射“机智”,即智能体的思维、意图与社会性行为。因此,“世界模型”不应被封闭于单个智能体体内。区块链、分布式推理、人机混合智能的出现,使“世界模型”正从孤立的岛屿转变为一种“共享的、可计算的认知基础设施”。它是大家(人+机+物)的“世界模型”——动态、开放、可演化,既描述世界,也生成世界,而非某个智能体私有的、静态的、端到端的黑箱。而世界模型的生命力即来自于“仿真计算”。没有仿真,世界模型便缺乏演化机制;没有“世界模型”,智能则失去理解与预测的框架,这便是“无仿真,不智能”的核心原因。

下面从智能体的外延、内核以及人机混合三个层面,阐述可计算世界模型如何成为未来智能发展的基石。

 

01外延层面:可计算世界模型作为“真实世界仿真器”

将视角推到智能体的外延,可计算世界模型便扮演着“真实世界仿真器”的角色。它要解决的是现实世界中智能体面临的核心困境:现实世界试错代价高昂、样本稀缺,而一个仅在少量真实数据上训练的智能体,其决策必然是狭隘和脆弱的。而一个集成了高保真可计算世界模型的智能体,则拥有了一个无限广阔的“试错任务空间”。在这个空间中,它可以应对极端场景:面对在现实世界中罕见或危险的“长尾”情况,仿真器可以生成海量的模拟数据,让智能体在安全的环境中经历“千锤百炼”,从而具备从容应对任何突发状况的鲁棒性。以自动驾驶为例,特斯拉的FSD系统每日在数千万公里的虚拟道路中进行策略迭代,其“影子模式”会在仿真场景下持续对比真实与预测的差异,从而不断修正模型权重。这种基于仿真的强化学习,使系统能够在遭遇极端场景(如冰雪路面、突发行人、信号失灵)时表现出超越人类直觉的性能。

另外,还可以基于可计算世界模型进行反事实推理:智能体可以回溯决策节点,通过蒙特卡洛仿真计算得到答案。这是形成深度策略和创造性解决方案的关键。通过提供近乎无限的、多样化的交互经验,将智能体的决策能力从“基于有限样本的拟合”提升到了“基于广博经验的洞察”,让决策变得越来越智能。OpenAI提出的“World Models”框架,让强化学习智能体通过在内部虚拟世界中进行反事实模拟,学习策略与后果之间的动态关系。这种通过仿真实现的“经验倍增”,智能体在无风险的虚拟环境中经历百万次生命史,以积累真实世界无法获得的智慧。

因此,可计算世界模型通过提供多样化的交互经验,使智能体的认知从“基于有限样本的拟合”跃升为“基于无限经验的洞察”。仿真成为智能体从数据学习走向理解学习的关键媒介。

 

 

图2 可计算世界模型作为“真实世界仿真器”

 

02内核层面:可计算世界模型作为“人工心理世界”

当前人工智能模型普遍存在的“黑箱”与“不可解释”问题,输入数据、输出结果,中间过程不可见、不可解释。智能体在这种模式下,如同行为主义式的“刺激—反应机”,缺乏自我理解。而一个内嵌了可计算世界模型的智能体,则可以在其内部“心理剧场”中,上演无数场思想实验:可以“机器经验”,通过仿真出自身在不同内部状态(如不同的目标、信念、情绪模拟)下的“心理活动”序列。如DeepMind在 2022 年提出的Gato模型(通用多模态智能体)尝试让同一个系统在感知、控制、语言等任务中建立统一的世界表征。它不仅学习环境规则,更在隐空间中形成了“任务迁移”的心理表象——这是一种类似人类“元认知”的雏形。这些内省式仿真计算所产生的数据,形成了智能体独有的“机器经验”,积累出对自身行为模式的认知。

 

图3 多模态表征的世界表征模型

 

再如Meta AI的“内省式RL”研究中,智能体通过在内部世界模型中演练不同的“信念状态”,实现了“机器经验”的积累。这样的内省式仿真让AI不再只是反应系统,而是能进行反思与重构的认知体。这一机制回应了人工智能的“可解释性危机”:解释不再依赖对黑箱的解剖,而在于智能体能否呈现其内部仿真过程。一个具有可计算世界模型的智能体,能够“回放”其决策路径,展示在不同假设下的推演逻辑——这使得AI决策从数学黑箱变为逻辑链条,从“行为正确”迈向“理解正确”。由此可见,内核层面的可计算世界模型,通过仿真技术孵化了智能体的内省意识,为端到端的智能黑箱打开了可解释的“天窗”。

 

03人机融合层面:可计算世界模型作为“共生认知空间”

如果说外延层面的可计算世界模型扩展了智能体的经验边界,内核层面的模型深化了其内省能力,那么在人机混合层面,可计算世界模型则成为连接人类与机器的“共生认知空间”。当前的人机交互,多数仍停留在指令传递层面,机器并不真正“理解”人的意图、上下文和价值判断。可计算世界模型为此提供了破局的路径:可以表征人类行为与意图,人的行为、决策模式、甚至模糊的价值偏好,都可以被尽可能多地表征为可计算的对象和规则。机器能在一个统一的逻辑空间里,理解这些动作背后的“目的”;可以活化人类智能,通过将人类专家的经验知识编码到世界模型的规则与约束中,让机器在推演中动态地运用人类的智慧,而不仅仅是依赖数据驱动。

在医疗仿真中,数字孪生人体模型不仅让医生观察病理演化,还让机智在相同仿真空间中提出治疗方案,人类专家可以在虚拟环境中验证、修改并重新训练模型,形成“人机共治”的医学认知系统。又如,在城市治理中,数字孪生城市(Digital Twin City)让政策制定者与AI共同在仿真沙盘上推演交通、能源、环境的联动效应,实现人类价值与算法优化的共演。在这个一致的空间里,人与机器可以进行基于同一套“物理定律”和“社会规则”的联合推演。人可以介入机器的决策循环,机器也可以预测并补足人的认知盲区。双方在同一个仿真沙盘中进行协同实验,最终实现从简单交互到深度共生的“人机混合超智能”。

 

 

图4“无仿真不智能”在具身智能世界模型中的体现

 

04结语

从智能体应对外部世界的无限可能,到构建内部心理的可计算意识,再到实现人机共生的认知空间,可计算世界模型在每个层面都以仿真为核心驱动力。仿真,使世界模型从静态符号转化为动态机制,使智能体从被动反应跃升为主动理解。没有仿真,世界模型便失去演化与推理的能力;没有世界模型,智能则失去感知、反思与共生的结构。正如物理学家约翰·惠勒所言:“世界不是由物质组成的,而是由信息生成的。”在智能时代,我们可以进一步补充——信息的生成离不开仿真的计算。无仿真,不智能;而仿真,正是让世界“可计算”的方法,也是让智能“可理解”的哲学。

郑重声明:文字内容整理源自网络,目的在于传递更多行业信息,不代表本网站立场和观点,如涉及转载文章、图片、观点、文字、版权和其他问题,请发至邮箱cdsn@cdsnet.com.cn,我们将及时更正或删除。本网站拥有对此声明的最终解释权。