宝玉@dotey · 2026-02-01

Lex Fridman播客深度解读AI现状与未来

摘要

本文基于Lex Fridman与两位AI研究者Sebastian Raschka和Nathan Lambert的四小时对话，系统梳理了2025-2026年AI领域的关键议题。对话覆盖中美AI竞争格局、主流模型对比、编程AI工具选择、开源与闭源之争、Transformer架构演进、规模定律现状、训练流程详解、后训练技术突破、入行建议以及行业工作文化等多个维度。两位专家从一线研究者和工程师的视角，提供了关于技术发展趋势、职业路径和行业生态的独特见解。

内容框架与概述

文章首先探讨中美AI竞争态势，指出DeepSeek通过开源赢得社区认可，而智谱AI、MiniMax等中国公司在2025年下半年表现更为亮眼。中国公司将持续开源作为进入美国市场的策略。接着比较主流模型表现，认为Gemini将蚕食ChatGPT份额，Anthropic在代码和企业端持续成功，并讨论了Claude Code和Cursor等编程AI工具的优势差异。

关于开源与闭源模型，文章分析了中国开源模型多采用大型MoE架构且许可证限制较少，美国偏好较小稠密模型。开源有助于获取用户、解决数据隐私和定制需求，更是培养研究者的关键途径。技术层面指出Transformer架构本质未变，主要是MoE、MLA、GQA等改进和系统优化。

规模定律部分澄清了预训练规模定律未死，但推理时扩展和RL扩展更具吸引力。训练流程分为预训练、中训和后训练三个阶段，其中RLVR成为2025年后训练最大突破。文章还提供了入行建议、讨论了996工作文化、硅谷泡沫现象，并介绍文本扩散模型等新研究方向。