Arman Hezarkhani@ArmanHezarkhani·1月20日 · 2026-01-20

成为机器学习工程师的完整指南

摘要

这篇文章提供了成为机器学习工程师的系统化学习路径。作者强调不能像看娱乐内容那样被动学习教程，而要采用两遍学习法，第一遍建立整体认知，第二遍主动实践并深入理解每个细节。文章将学习分为两个阶段：第一阶段通过3Blue1Brown的视频建立数学和神经网络的视觉直觉，用时约10-15小时；第二阶段跟随Andrej Karpathy从零构建模型，培养实际编码能力，用时约30-40小时。整个路径强调动手实践，要求学习者逐行输入代码而非复制粘贴，通过破坏和修改代码来深入理解原理。

内容框架与概述

文章开篇就指出大多数人在学习技术内容时的致命错误，即把教育视频当作娱乐内容消费。作者提出两遍学习法，第一遍快速浏览建立知识框架，第二遍深度学习并动手实践。这种方法看似缓慢，实则是真正有效的学习方式。作者还澄清了机器学习工程师的工作性质，既不同于数据科学家也不同于研究员，主要是将研究成果转化为可实际运行的系统。

第一阶段学习聚焦于建立数学直觉，通过3Blue1Brown的系列视频，从神经网络的基本概念开始，逐步深入到梯度下降、反向传播等核心算法，最后过渡到现代大型语言模型和Transformer架构。这个阶段大约需要10-15小时，虽然不涉及太多代码，但为后续实践打下了坚实的理论基础。

第二阶段转向实战训练，通过跟随Andrej Karpathy的教程从零构建自动微分引擎和语言模型。这个阶段需要30-40小时，要求学习者具备Python基础和基本数学知识。关键在于必须亲手输入每一行代码，理解每个实现细节，通过构建完整的系统来深化对机器学习原理的理解。