2025-10-04

苦涩的教训

摘要

Rich Sutton在2019年发表的《苦涩教训》一文，基于70年AI发展史得出核心结论：能够充分利用计算资源的通用算法（搜索与学习）最终总会碾压依赖人类领域知识的专家系统。摩尔定律带来的算力指数增长是根本原因。研究者虽倾向于注入人类经验以获得短期成效，但这往往成为长期进步的障碍。

文章开篇即点明主题：AI领域70年的历史反复证明，最终取胜的总是能随算力扩展的通用方法，而非精心设计的人类知识系统。摩尔定律使计算成本持续下降，这意味着着眼长远的研究应优先选择可利用大规模算力的技术路径。

Sutton通过四个经典案例论证这一观点：1997年Deep Blue用大规模搜索击败Kasparov，AlphaGo用自我对弈学习碾压围棋专家系统，语音识别中统计方法战胜音素建模，计算机视觉从特征工程转向深度卷积网络。每个领域都经历了相似的转变——精心构建的人类知识最终被证明无关紧要甚至有害。

文章最后升华为方法论框架：研究者应聚焦于设计能够发现复杂性的元方法，而非试图直接建模世界的复杂结构。同时需克服心理障碍——对人类方法的情感依恋和对通用方法"不够人性化"的抵触，这是持续进步的关键。

苦涩教训（Bitter Lesson）：人类知识注入虽短期有效且令人满足，但长期必被算力驱动的通用方法超越，这一规律令倾注心血的研究者难以接受，故称"苦涩"。

搜索与学习（Search & Learning）：Sutton认定这是仅有的两类能无限随算力扩展的技术，前者如深度博弈树搜索，后者如深度学习和自我对弈，二者是AI突破的核心引擎。

摩尔定律（Moore’s Law）：单位计算成本的指数级下降是通用方法最终胜出的物质基础，使得假设算力不变的研究策略注定短视。

元方法（Meta-methods）：不应直接建模空间、物体等复杂概念，而应设计能自主发现和逼近任意复杂结构的算法，让系统自己学会"如何思考"。

此摘要卡片由 AI 自动生成