Gary Marcus · 2026-02-11

万亿投资难解困境：LLM推理能力根本性缺陷暴露

摘要

本文引用加州理工学院和斯坦福大学最新发表的综述论文，指出当前大型语言模型在推理能力上存在系统性缺陷。尽管业界已投入近万亿美元，主流AI系统仍频繁产生荒谬错误。研究详细梳理了推理失败的各种表现，呼吁科技行业正视这一根本性挑战，放弃单纯依赖规模扩张的策略，转向探索真正能够实现逻辑推理的替代技术路线。

内容框架与概述

文章开篇回顾了Gary Marcus自2012年以来对深度学习推理能力的持续质疑，指出因果关系表示、抽象概念获取和逻辑推理等核心问题始终未获解决。面对学术界长期以来的批评声音，硅谷巨头们选择充耳不闻，继续以"规模即一切"的姿态押注 Scaling Law，重复承诺AGI即将实现。

文章核心引用了Caltech和Stanford学者最新发布的综述论文《Large Language Model Reasoning Failure》，该论文系统梳理了当前主流LLM在各类推理任务中的失败案例，涵盖范围之广、问题之深令人警醒。尽管技术不断迭代、营销话术不断升级，幻觉和低级错误依然普遍存在。

作者最后提出十字路口选择：硅谷可以继续掩耳盗铃、祈祷奇迹降临，也必须正视现实、认真探索超越传统LLM架构的替代方案。