Annual Report

2025
LLM Review

— Andrej Karpathy

幽灵
心智

从模仿人类到“召唤幽灵”。RLVR范式通过自动化验证奖励，催生出一种非人类的、锯齿状的机器智力。它们在特定领域是天才，在常识上却是困惑的孩童。

“Vibe Coding”让编程民主化，代码变得极其廉价且短暂。AI不再只是云端服务，而是驻留在本地（Localhost）的数字生灵，彻底重构了人机交互的界面与本质。

“LLM 正在涌现为一种新型智力，它同时比预期的聪明得多，也愚蠢得多。我们甚至未能触及它们 10% 的潜力。”

Source: Karpathy.bearblog.dev Designed with AI JAN 04 2026

PARADIGM SHIFTS & TACTICS

RLVR

2025年的核心训练范式。通过数学或代码等可验证领域的奖励机制，模型自发习得类似“推理”的策略。这不仅延长了训练时间，更开启了通过增加“思考时间”来换取智能的新 Scaling Law。

JAGGED

我们不是在培养动物，而是在召唤幽灵。LLM展现出极端的“锯齿状”能力分布：在某些领域是全知天才，在常识上却是困惑的小学生。不能再用生物进化的逻辑来审视这种完全不同的实体。

CURSOR

Cursor揭示了新的LLM应用层厚度。它不仅是编辑器，更是复杂的上下文工程师和多模型调度中心。未来的应用将由LLM实验室提供“大学毕业生”，而应用层负责将其训练为特定领域的“职业专家”。

CLAUDE

AI不再只是网页聊天框，而是栖息在你电脑里的“灵体”。Claude Code证明了本地化Agent的优越性：直接访问私有数据与环境，与开发者协同工作。这是通往AGI过程中最务实的交互形态。

VIBE

编程门槛彻底崩塌。代码变得免费、短暂且可丢弃。无论是专家还是普通人，仅凭自然语言（Vibe）即可构建软件。这不仅改变了软件生产方式，更将彻底重塑程序员的职业定义。

NANO

文本是计算机的语言，而非人类的首选。Gemini Nano展示了未来的方向：LLM应当以人类偏好的视觉、空间形式（图表、幻灯片、UI）进行输出。这是计算范式从命令行向图形界面进化的AI版本。

Source: Karpathy.bearblog.dev Designed with AI JAN 04 2026