Latent.Space · 2026-02-17

阿里 Qwen3.5:最小的高性能开放式模型

摘要

阿里巴巴发布 Qwen3.5-397B-A17B,这是 Qwen3.5 系列的首个开源权重模型。该模型采用混合架构,结合线性注意力和稀疏 MoE,总参数 397B 但仅 17B 激活参数。原生多模态能力和空间智能是其亮点,支持 201 种语言,上下文窗口达 256K。KV-cache 效率极高,约 31KB/token,在 Apple Silicon 上也可本地运行。文章还讨论了 Agent 领域的 Harness 工程化趋势,以及 OpenClaw 被收购后引发的开源生态思考。

内容框架与概述

文章首先介绍了 Qwen3.5-397B-A17B 的核心发布信息。作为 400B 参数级别的模型,其 4.3% 的稀疏率使推理保持可操作性。这是中国最活跃的开源模型实验室的重要更新,可能也是 DeepSeek v4 发布前的最后一代产品。

技术架构方面,模型采用 Gated Delta Networks 加稀疏 MoE 设计。这种架构使 KV-cache 高度高效,BF16 格式下约 31KB/token,262K 上下文时仅需约 8GB。尽管模型权重约 800GB,但社区已证明可在 Apple Silicon 上通过量化本地运行。

Agent 生态讨论占据了大量篇幅。OpenClaw 被收购的故事成为单人团队加编码 Agent 的典型案例,但也引发了对 Anthropic 限制开源策略的批评。核心观点是 Agent 的竞争力不仅在于模型,更在于 Harness——包括工具集成、上下文管理、生命周期和可观测性在内的整体工程体系。

核心概念及解读

稀疏 MoE(Sparse MoE):混合专家模型架构,总参数量巨大但每次推理只激活少量参数,平衡性能与效率。

Gated Delta Networks:一种新型神经网络层结构,配合 MoE 使长上下文推理保持可操作性,显著降低 KV-cache 内存占用。

Harness 工程:Agent 系统中围绕模型的基础设施,包括工具集成、上下文管理、评估和可观测性,被视为 Agent 的真正护城河。


原文信息

字段内容
原文[AINews] Qwen3.5-397B-A17B:the smallest Open-Opus class, very efficient model
作者Latent.Space
发表日期2026-02-17

此摘要卡片由 AI 自动生成