Andrej Karpathy · 2025-08-30

AI时代的三次进化

人工智能的学习范式正在经历深刻的变革，这一过程被划分为三个核心的进化阶段。最初的预训练时代以大规模互联网文本为基础，构建了模型对世界的广泛理解。随后，通过监督微调（SFT），模型开始在人类对话数据的引导下，优化其指令遵循和交互能力。

然而，真正的飞跃在于第三阶段：强化学习。在这一阶段，AI不再仅仅处理静态数据，而是通过与环境进行交互、根据反馈调整行动，从而实现智能体的自主进化。这种从静态文本理解到动态环境交互的转变，标志着AI从单纯的预测工具向具备行动能力的智能体迈进。

AI时代的三次进化全屏