中国AI初创企业:超越DeepSeek的四大值得关注的公司
摘要
自2022年ChatGPT发布以来,中国科技界一直在努力开发本土的AI替代品,催生了众多初创企业和数十亿美元的投资。DeepSeek作为中国AI初创企业的代表,其快速崛起震惊了全球。本文介绍了四家除了DeepSeek之外值得关注的中国AI初创企业——Stepfun、ModelBest、Zhipu和Infinigence AI,它们各自在不同的技术方向上展现出独特优势,从基础模型开发到小型化部署,再到异构计算基础设施,构成了中国AI生态系统的重要组成部分。
内容框架与概述
中国AI初创企业的发展已经进入了一个新的阶段,从最初的快速冲刺逐渐转变为一场高风险的马拉松。目前,中国的AI赛道由阿里巴巴、字节跳动等科技巨头以及一些资金雄厚的竞争对手主导。然而,随着AI技术的发展,一些小型创新企业也开始崭露头角,它们需要找到自己的独特定位,否则可能会被市场淘汰。
文章重点介绍了四家各具特色的AI初创企业。Stepfun由前微软高管创立,以开发人工通用智能(AGI)为目标,在2024年发布了11个基础AI模型,其Step-2模型在LiveBench排名中仅次于顶级国际模型。ModelBest则走小型化路线,专注于效率导向的小型语言模型,其MiniCPM系列专为设备端实时处理设计,在降低成本和增强隐私保护方面具有优势。Zhipu起源于清华大学,与政府和学术界联系紧密,正在开发对话模型ChatGLM和视频生成器Ying,但已成为美国出口管制的目标。Infinigence AI专注于基础设施建设,其异构计算集群技术能够优化不同芯片架构之间的协同工作,为中国AI企业在芯片受限环境下提供了新的解决方案。
这些公司的发展路径反映了中国AI初创企业的多元化趋势。一些公司如Minimax和Moonshot放弃了成本高昂的基础模型训练,转而专注于面向消费者的应用程序开发;而像Stepfun和Infinigence AI这样的公司则加倍投入研究,部分原因是受到美国半导体限制的影响。这种分化既是对市场现实的回应,也是在技术封锁下的创新探索。
核心概念及解读
人工通用智能(AGI):Stepfun仍将AGI作为其发展目标,这在中国初创企业中已经不多见。AGI指的是具备与人类相当或超越人类水平通用智能的AI系统,能够在各种任务中表现出类人的学习和推理能力。随着AI竞争的加剧,许多中国初创企业已经转向更务实的应用开发,Stepfun的坚持使其在基础模型研究领域保持了独特定位。
小型语言模型(SLM):ModelBest专注于小型语言模型的开发,其MiniCPM 3.0只有40亿个参数,但在各种基准测试中的表现与GPT-3.5相当。小型语言模型的优势在于可以在智能手机、PC、汽车系统等设备上进行实时处理,降低成本并增强隐私保护。这种"小而美"的路线代表了中国AI企业在算力受限环境下的一种务实选择。
异构计算集群:Infinigence AI的核心技术是将不同品牌的芯片组合起来执行AI任务,形成"异构计算集群"。由于美国芯片制裁,中国AI公司无法获得最先进的英伟达芯片,因此需要学会使用AMD、华为等多种芯片。Infinigence AI的技术通过优化不同芯片架构之间的协同工作,声称可以将AI模型训练时间缩短30%,这为中国AI企业提供了一条在技术封锁下维持创新能力的路径。
“六虎”:这是对中国AI领域六家领先初创企业的统称,包括Stepfun、智谱、Minimax、Moonshot、01.AI和百川。这些公司被认为是中国AI领域的佼佼者,获得了大量投资和政府支持。然而,随着竞争加剧和市场分化,“六虎"之间的发展路径也开始出现差异。
出口管制与技术主权:Zhipu成为新一批中国AI初创企业中第一个受到美国政府关注的公司,其10家子公司被列入限制贸易名单。美国声称Zhipu的技术正在帮助中国的军事,但该公司对此予以否认。这一事件凸显了AI技术竞争背后的地缘政治因素,也迫使中国AI企业加快技术自主化的步伐。
原文信息
| 字段 | 内容 |
|---|---|
| 原文 | Four Chinese AI startups to watch beyond DeepSeek |
| 作者 | MIT Technology Review |
| 发表日期 | 2025-02-04 |
此文档由 AI 自动整理