Ankit Maloo · 2026-02-08

专家拥有世界模型，LLM只有文字模型

摘要

本文探讨专家与大型语言模型之间的根本差异：专家拥有世界模型，能预测对手如何利用其工作成果，而LLM仅能生成在孤立评估中表现优秀的输出。文章通过Slack消息、象棋与扑克等对比案例，揭示了完美信息与不完全信息环境下推理的差异，指出在存在隐藏信息和竞争对手适应性反应的场景中，静态模式匹配会失效。

内容框架与概述

文章首先以Slack消息为例，生动展示了专家与LLM的思维差距：看似礼貌的请求因忽视接收方的优先级算法和模糊请求带来的风险而被忽视。接着对比象棋和扑克，阐明完美信息游戏无需心智理论，而不完美信息游戏中 bluffing 和识破 bluff 都依赖于对对手心理的递归建模。

随后介绍Meta的Pluribus扑克AI，其通过计算所有可能手牌并平衡策略，使对手的因果推理失效，展示了对抗性鲁棒性的实现方式。最后指出LLM训练依赖静态反馈，缺乏环境对抗性反馈，导致系统性地低估二阶效应，即对方如何解读和回应你的行动。

核心概念及解读

世界模型：对环境和其他主体行为模式的内部模拟，使持有者能预测行动落地后的反应和潜在漏洞。对抗性推理：在竞争对手有适应性、信息不对称和隐藏动机的场景中进行决策和行动规划的能力。隐藏状态：博弈中对手拥有但你无法观察的私有信息和不公开的激励约束，是将最优计算问题转化为信念管理问题的关键变量。Pluribus策略：通过计算所有可能手牌并平衡行动频率，使对手无法从行为中提取一致性信息，从而实现不可读性。