Andrej Karpathy
·
2025-08-30
AI时代的三次进化
人工智能的学习范式正在经历深刻的变革,这一过程被划分为三个核心的进化阶段。最初的预训练时代以大规模互联网文本为基础,构建了模型对世界的广泛理解。随后,通过监督微调(SFT),模型开始在人类对话数据的引导下,优化其指令遵循和交互能力。
然而,真正的飞跃在于第三阶段:强化学习。在这一阶段,AI不再仅仅处理静态数据,而是通过与环境进行交互、根据反馈调整行动,从而实现智能体的自主进化。这种从静态文本理解到动态环境交互的转变,标志着AI从单纯的预测工具向具备行动能力的智能体迈进。