阿里 Qwen3.5:最小的高性能开放式模型
摘要
阿里巴巴发布 Qwen3.5-397B-A17B,这是 Qwen3.5 系列的首个开源权重模型。该模型采用混合架构,结合线性注意力和稀疏 MoE,总参数 397B 但仅 17B 激活参数。原生多模态能力和空间智能是其亮点,支持 201 种语言,上下文窗口达 256K。KV-cache 效率极高,约 31KB/token,在 Apple Silicon 上也可本地运行。文章还讨论了 Agent 领域的 Harness 工程化趋势,以及 OpenClaw 被收购后引发的开源生态思考。
内容框架与概述
文章首先介绍了 Qwen3.5-397B-A17B 的核心发布信息。作为 400B 参数级别的模型,其 4.3% 的稀疏率使推理保持可操作性。这是中国最活跃的开源模型实验室的重要更新,可能也是 DeepSeek v4 发布前的最后一代产品。
技术架构方面,模型采用 Gated Delta Networks 加稀疏 MoE 设计。这种架构使 KV-cache 高度高效,BF16 格式下约 31KB/token,262K 上下文时仅需约 8GB。尽管模型权重约 800GB,但社区已证明可在 Apple Silicon 上通过量化本地运行。
Agent 生态讨论占据了大量篇幅。OpenClaw 被收购的故事成为单人团队加编码 Agent 的典型案例,但也引发了对 Anthropic 限制开源策略的批评。核心观点是 Agent 的竞争力不仅在于模型,更在于 Harness——包括工具集成、上下文管理、生命周期和可观测性在内的整体工程体系。
核心概念及解读
稀疏 MoE(Sparse MoE):混合专家模型架构,总参数量巨大但每次推理只激活少量参数,平衡性能与效率。
Gated Delta Networks:一种新型神经网络层结构,配合 MoE 使长上下文推理保持可操作性,显著降低 KV-cache 内存占用。
Harness 工程:Agent 系统中围绕模型的基础设施,包括工具集成、上下文管理、评估和可观测性,被视为 Agent 的真正护城河。
原文信息
| 字段 | 内容 |
|---|---|
| 原文 | [AINews] Qwen3.5-397B-A17B:the smallest Open-Opus class, very efficient model |
| 作者 | Latent.Space |
| 发表日期 | 2026-02-17 |
此摘要卡片由 AI 自动生成