2025-04-01

MIT 6.S191 (2025) 第一讲：深度学习导论

摘要

本文记录了MIT深度学习入门课程6.S191的第一讲内容。讲师Alexander Amini通过现场语音克隆演示展示了生成式AI的飞速发展，系统阐述了智能、人工智能、机器学习与深度学习的层级关系。讲座从感知器这一基本单元出发，逐步构建多层神经网络架构，详细讲解激活函数、损失函数、梯度下降和反向传播等核心概念，并探讨了学习率调整、过拟合与正则化等实践问题。

内容框架与概述

文章开篇以震撼的现场演示引入——讲师使用其实时录制的声音进行即时克隆和动态对话，与2020年需要耗费大量资源生成静态视频的技术形成鲜明对比，生动展现了近年来生成式AI的巨大进步。随后，讲座明确界定了从智能到人工智能、机器学习再到深度学习的概念递进关系，强调深度学习的核心在于让计算机从数据中自主学习模式而非显式编程。

讲座主体部分系统介绍了神经网络的基础知识。从单个感知器的前向传播讲起，阐述输入、权重、偏置和激活函数的作用机制，重点说明非线性激活函数对于处理现实世界复杂数据的重要性。课程逐步扩展到多层神经网络的构建，包括密集层、深度网络架构等概念。在训练环节，详细讲解损失函数的定义、梯度下降优化算法以及反向传播原理，揭示了神经网络如何通过迭代优化逐步提升性能。

最后，讲座深入探讨了训练深度学习模型的实践考量。分析了损失景观的复杂性，讨论了学习率、自适应学习率、随机梯度下降与小批量梯度下降等优化策略。针对过拟合这一常见问题，介绍了Dropout正则化技术和早停法等有效解决方案。课程预告下一讲将聚焦深度序列建模，为学员构建完整的知识体系。