Annual Report

2025
LLM Review

— Andrej Karpathy

01

幽灵
心智

从模仿人类到“召唤幽灵”。RLVR范式通过自动化验证奖励,催生出一种非人类的、锯齿状的机器智力。它们在特定领域是天才,在常识上却是困惑的孩童。

02

代码
消融

“Vibe Coding”让编程民主化,代码变得极其廉价且短暂。AI不再只是云端服务,而是驻留在本地(Localhost)的数字生灵,彻底重构了人机交互的界面与本质。

“LLM 正在涌现为一种新型智力,它同时比预期的聪明得多,也愚蠢得多。我们甚至未能触及它们 10% 的潜力。”

Source: Karpathy.bearblog.dev Designed with AI JAN 04 2026

关键范式

PARADIGM SHIFTS & TACTICS

02

推理强化

RLVR

2025年的核心训练范式。通过数学或代码等可验证领域的奖励机制,模型自发习得类似“推理”的策略。这不仅延长了训练时间,更开启了通过增加“思考时间”来换取智能的新 Scaling Law。

锯齿智能

JAGGED

我们不是在培养动物,而是在召唤幽灵。LLM展现出极端的“锯齿状”能力分布:在某些领域是全知天才,在常识上却是困惑的小学生。不能再用生物进化的逻辑来审视这种完全不同的实体。

应用编排

CURSOR

Cursor揭示了新的LLM应用层厚度。它不仅是编辑器,更是复杂的上下文工程师和多模型调度中心。未来的应用将由LLM实验室提供“大学毕业生”,而应用层负责将其训练为特定领域的“职业专家”。

本地驻留

CLAUDE

AI不再只是网页聊天框,而是栖息在你电脑里的“灵体”。Claude Code证明了本地化Agent的优越性:直接访问私有数据与环境,与开发者协同工作。这是通往AGI过程中最务实的交互形态。

直觉编程

VIBE

编程门槛彻底崩塌。代码变得免费、短暂且可丢弃。无论是专家还是普通人,仅凭自然语言(Vibe)即可构建软件。这不仅改变了软件生产方式,更将彻底重塑程序员的职业定义。

原生界面

NANO

文本是计算机的语言,而非人类的首选。Gemini Nano展示了未来的方向:LLM应当以人类偏好的视觉、空间形式(图表、幻灯片、UI)进行输出。这是计算范式从命令行向图形界面进化的AI版本。

Source: Karpathy.bearblog.dev Designed with AI JAN 04 2026