Qwen3.6-27B-MTP-GGUF (Unsloth)
Qwen3.6-27B的MTP量化版,推理速度1.5-2倍提升
- 部署
-
- py llama.cpp llama-server -hf unsloth/Qwen3.6-27B-MTP-GGUF:UD-Q4_K_XL --spec-type draft-mtp
- py Unsloth Studio直接加载并交互
归档 / 2026-05-18 / Qwen3.6-27B-MTP-GGUF (Unsloth)
Qwen3.6-27B的MTP量化版,推理速度1.5-2倍提升
GGUF格式即用,下载量26万+,被llama.cpp引用;但仅量化打包,无新增能力,外部评测证据不足