Qwen3.6-35B-A3B 发布：阿里通义千问最新 MoE 模型，35B 参数仅激活 3B – 定风波

前言

2026年4月，阿里通义千问团队发布 Qwen3.6-35B-A3B，这是 Qwen3.6 系列的首个开源权重变体。作为一款 MoE（Mixture-of-Experts）架构模型，它在保持 35B 总参数的同时，每次推理仅激活 3B 参数，实现了性能与效率的完美平衡。

Qwen3.6-35B-A3B 采用混合专家架构：

这种设计使得模型在保持强大能力的同时，推理成本大幅降低，非常适合生产环境部署。

Qwen3.6 在代码生成方面有显著提升：

特别值得一提的是，模型支持Thinking Preservation（思考保留），可以保留历史消息的推理上下文，非常适合迭代开发和复杂任务。

Qwen3.6-35B-A3B 不仅擅长文本处理，还具备强大的视觉理解能力：

在文档理解、图表分析、视频理解等任务上表现出色，适合构建多模态应用。

Qwen3.6-35B-A3B 的架构设计颇具特色：

这种创新的架构设计，结合了 DeltaNet 线性注意力和传统注意力机制的优势。

与同类模型相比，Qwen3.6-35B-A3B 在多个基准测试中表现优异：

测试项目	Qwen3.6-35B-A3B	Qwen3.5-35B-A3B	Gemma4-31B
SWE-bench Verified	73.4	70.0	52.0
MMLU-Pro	85.2	85.3	85.2
AIME26	92.7	91.0	89.2
GPQA	86.0	84.2	84.3

可以看到，Qwen3.6 在代码生成和 STEM 推理方面有明显优势。

Qwen3.6-35B-A3B 支持多种推理框架：

模型可通过 Hugging Face 和 ModelScope 下载，支持本地部署和 API 调用。

基于 Qwen3.6-35B-A3B 的特性，适合以下场景：

Qwen3.6-35B-A3B 是通义千问团队在 MoE 架构上的又一次突破。通过创新的 Gated DeltaNet + MoE 设计，模型在保持强大能力的同时，推理成本大幅降低。对于需要高效部署、长上下文处理和多模态能力的开发者来说，这是一个值得尝试的选择。

本文基于 Qwen3.6-35B-A3B 官方发布信息整理，更多技术细节请参考 Hugging Face 模型页面。