Investing.com / Reuters · 2025-08-15

DeepSeek新一代AI模型因华为芯片问题推迟发布

摘要

DeepSeek原计划于2025年5月发布其新一代AI模型R2,但由于在使用华为Ascend(昇腾)芯片进行训练时遭遇持续性技术难题,项目进展严重受阻。最终,DeepSeek被迫转用Nvidia H20芯片完成模型训练,仅在推理阶段使用Ascend芯片。这一事件集中体现了中国AI企业在"去美化"进程中面临的技术瓶颈,以及在中美科技竞争背景下的产业链自主化困境。

内容框架与概述

本文围绕DeepSeek R2模型推迟发布这一事件,揭示了三个层面的核心问题。首先,从技术层面看,DeepSeek原本计划采用华为Ascend芯片进行AI模型训练,但在高强度计算需求面前遇到了难以克服的技术障碍,不得不回归Nvidia H20芯片。这表明国产芯片在高端AI训练场景下的性能和生态成熟度仍有显著差距。

其次,从产业政策层面看,尽管美国政府对中国高端芯片实施出口限制,中国政府也鼓励本土企业采用国产芯片,但市场主体的实际选择反映出政策导向与技术现实之间的张力。DeepSeek R1模型、字节跳动、腾讯、阿里巴巴等中国主要AI开发者普遍依赖Nvidia芯片,这一现状短期内难以根本改变。

最后,从市场竞争层面看,R2模型的推迟使DeepSeek在国内外AI"军备竞赛"中暂时处于不利地位。尽管R2预计将在未来数周内发布,但已错过新品发布的关键窗口期。这一事件也促使外界更加关注中国AI产业链自主化的真实进展,以及在"短期依赖"与"长期自主"之间的平衡路径。

核心概念及解读

训练与推理的算力差异:AI模型开发分为训练和推理两个阶段。训练阶段需要利用海量数据反复迭代优化模型参数,对算力要求极高;推理阶段则是模型在实际应用中生成响应的过程,算力需求相对较低。DeepSeek的案例显示,华为Ascend芯片目前能够支撑推理任务,但在高强度训练环节仍存在明显短板,这反映了国产芯片在不同应用场景下的技术成熟度差异。

去美化进程的现实困境:在中美科技竞争背景下,减少对美国技术的依赖是中国AI产业的重要战略方向。然而,DeepSeek被迫在训练环节放弃华为芯片、转而使用Nvidia产品的决策,凸显了这一进程中的现实挑战。技术选型最终仍需以产品性能和市场竞争力为依归,政策导向不能完全替代技术规律。

渐进式自主化路径:从DeepSeek、字节跳动等企业的实践来看,中国AI芯片自主化必然是一个渐进过程。短期内,Nvidia等美制芯片仍是高端AI训练的主力选择;中长期则需要国产芯片厂商在硬件性能、软件生态、产业链协同等多方面持续投入。这一过程需要企业和政策制定者保持战略定力,在保障技术竞争力与推动自主可控之间找到动态平衡。


原文信息

字段内容
原文DeepSeek delays new AI model amid Huawei chip issues- FT
作者Investing.com / Reuters
发表日期2025

此文档由 AI 自动整理