归档 / 2026-05-18 / Qwen3.6-27B-MTP-GGUF (Unsloth)

Qwen3.6-27B-MTP-GGUF (Unsloth)

观察

Qwen3.6-27B的MTP量化版,推理速度1.5-2倍提升

部署
  • py llama.cpp llama-server -hf unsloth/Qwen3.6-27B-MTP-GGUF:UD-Q4_K_XL --spec-type draft-mtp
  • py Unsloth Studio直接加载并交互
对位
替代原始Qwen3.6-27B,大幅减少资源占用
适合
代码编写与Agent任务 / 本地多模态推理与节省显存
不适合
低内存或无GPU环境
规模
27B · 262k (可扩展至1M) · Apache-2.0
框架
llama.cpp / Unsloth Studio
可信度
下载量268k,基于官方Qwen3.6-27B,Unsloth动态量化,Apache-2.0许可

评分详情

Q1
今天能接上用吗   5 / 5
Q2
有可信证据吗   3 / 5
Q3
是新东西吗   1 / 5
总分
9
判定
LLM: 观察  →  规则: 观察

GGUF格式即用,下载量26万+,被llama.cpp引用;但仅量化打包,无新增能力,外部评测证据不足

HuggingFace 原始数据 (抓取于 2026-05-18)

作者
unsloth
任务类型
image-text-to-text
推理库
transformers
下载
268,305
点赞
254
许可证
Apache-2.0
标签
transformers, gguf, unsloth, qwen, qwen3_5, image-text-to-text, base_model:Qwen/Qwen3.6-27B, base_model:quantized:Qwen/Qwen3.6-27B, license:apache-2.0, endpoints_compatible, region:us, imatrix, conversational

探索

源链接 ↗