Andrej Karpathy · 2025-12-21

2025 年 LLM 年度回顾

摘要

本文是Karpathy对2025年LLM领域的年度回顾,梳理了六个令他印象深刻的"范式转变"。文章指出RLVR成为LLM训练的新关键阶段,AI展现出与人类截然不同的"锯齿状"智能特征。在应用层面,Cursor开创了垂直领域LLM应用的新模式,Claude Code展示了本地化AI代理的形态,而"Vibe Coding"让普通人也能通过自然语言编程。最后,Google的Nano Banana预示着LLM GUI时代的来临。

内容框架与概述

文章以时间线为轴,从技术基础到应用落地,系统性地回顾了2025年LLM领域的重大进展。开篇首先聚焦于训练范式的演进——RLVR(可验证奖励强化学习)作为继预训练、SFT和RLHF之后的第四阶段,通过在数学和代码等可自动验证的领域进行长时间优化,使LLM自发习得类似"推理"的能力,这一突破定义了2025年能力提升的主旋律。

随后,Karpathy深入探讨了对AI智能本质的认知转变。他提出我们并非在"培育动物",而是在"召唤幽灵"——LLM的智能呈现出独特的"锯齿状"特征,在某些领域展现天才般的能力,却又可能被简单的越狱攻击轻易欺骗。这种认知框架帮助我们理解为何AI能击败所有基准测试却仍未达到AGI。

文章下半部分转向应用生态的变革。Cursor的崛起揭示了LLM应用层的新范式——通过上下文工程、多模型调度和领域GUI为特定垂直行业服务。Claude Code则开创了"本地AI代理"的交互模式,以CLI形态驻留在用户电脑中协同工作。Vibe Coding让编程不再是专业人士的专利,任何人都能用自然语言构建软件,代码变得"免费、短暂、可丢弃"。最后,Google的Nano Banana预示着LLM将超越纯文本交互,走向可视化、图形化的GUI时代。

核心概念及解读

RLVR(可验证奖励强化学习):区别于依赖人类反馈的RLHF,RLVR通过数学、代码等可自动验证的任务进行长时间强化训练,使模型自主发展出推理策略,成为2025年LLM能力提升的核心驱动力。

Jagged Intelligence(锯齿状智能):形容AI智能的不均衡特性——在某些领域超越人类专家,在另一些领域却表现得像困惑的小学生。这源于LLM与人类截然不同的优化压力和训练目标。

Vibe Coding(氛围编程):一种全新的编程范式,用户通过自然语言描述需求即可生成代码,无需深入理解底层实现。它赋能普通人进入编程领域,也让专业开发者能快速实现原本不会动手写的项目。

Claude Code本地代理模式:区别于云端部署的AI,Claude Code运行在用户本地环境中,能够访问私有数据和上下文,以CLI形态与开发者协同工作,代表了AI交互的新范式。

LLM GUI:类比计算机从命令行到图形界面的演进,LLM也将从纯文本聊天走向图像、信息图、动画等可视化输出形式,Google Nano Banana是这一趋势的早期信号。


原文信息

字段内容
原文(14) X
作者Andrej Karpathy@karpathy·Dec 20
发表日期2025-12-20

此摘要卡片由 AI 自动生成