归档 / 2026-05-19 / Qwen3.6-35B-A3B-GGUF (Unsloth)

Qwen3.6-35B-A3B-GGUF (Unsloth)

推荐

支持MTP加速的3B激活参数量化视觉语言模型,面向本地编程代理

部署
  • py llama-server -hf unsloth/Qwen3.6-35B-A3B-MTP-GGUF:UD-Q4_K_XL --spec-type draft-mtp --spec-draft-n-max 6
  • py Unsloth Studio 图形界面直接运行 MTP 模型
对位
对位 Qwen3.5-35B-A3B、Gemma4-26B-A4B
适合
本地多模态推理与编程代理 (MTP加速) / 视觉问答、文档理解与工具调用
不适合
要求原始精度的量化敏感场景
规模
35B (3B active, Q4_K_XL) · 262k (可扩展至1M) · Apache-2.0
框架
llama.cpp / ollama / Unsloth Studio
可信度
HuggingFace 23.7万下载,Qwen官方Apache-2.0,Unsloth提供原生MTP GGUF量化

评分详情

Q1
今天能接上用吗   5 / 5
Q2
有可信证据吗   5 / 5
Q3
是新东西吗   1 / 5
总分
11
判定
LLM: 推荐  →  规则: 推荐

GGUF 格式可直接用 llama.cpp 部署,下载量 23 万+,是 Qwen3.6 量化版,非新能力。

HuggingFace 原始数据 (抓取于 2026-05-19)

作者
unsloth
任务类型
image-text-to-text
推理库
transformers
下载
237,613
点赞
249
许可证
Apache-2.0
标签
transformers, gguf, unsloth, qwen, qwen3_5_moe, image-text-to-text, base_model:Qwen/Qwen3.6-35B-A3B, base_model:quantized:Qwen/Qwen3.6-35B-A3B, license:apache-2.0, endpoints_compatible, region:us, imatrix, conversational

探索

源链接 ↗