Latent.Space · 2026-02-17

阿里 Qwen3.5：最小的高性能开放式模型

摘要

阿里巴巴发布 Qwen3.5-397B-A17B，这是 Qwen3.5 系列的首个开源权重模型。该模型采用混合架构，结合线性注意力和稀疏 MoE，总参数 397B 但仅 17B 激活参数。原生多模态能力和空间智能是其亮点，支持 201 种语言，上下文窗口达 256K。KV-cache 效率极高，约 31KB/token，在 Apple Silicon 上也可本地运行。文章还讨论了 Agent 领域的 Harness 工程化趋势，以及 OpenClaw 被收购后引发的开源生态思考。

内容框架与概述

文章首先介绍了 Qwen3.5-397B-A17B 的核心发布信息。作为 400B 参数级别的模型，其 4.3% 的稀疏率使推理保持可操作性。这是中国最活跃的开源模型实验室的重要更新，可能也是 DeepSeek v4 发布前的最后一代产品。

技术架构方面，模型采用 Gated Delta Networks 加稀疏 MoE 设计。这种架构使 KV-cache 高度高效，BF16 格式下约 31KB/token，262K 上下文时仅需约 8GB。尽管模型权重约 800GB，但社区已证明可在 Apple Silicon 上通过量化本地运行。

Agent 生态讨论占据了大量篇幅。OpenClaw 被收购的故事成为单人团队加编码 Agent 的典型案例，但也引发了对 Anthropic 限制开源策略的批评。核心观点是 Agent 的竞争力不仅在于模型，更在于 Harness——包括工具集成、上下文管理、生命周期和可观测性在内的整体工程体系。