归档 / 2026-05-19

今日推荐 (1)

推荐

支持MTP加速的3B激活参数量化视觉语言模型,面向本地编程代理

部署
  • py llama-server -hf unsloth/Qwen3.6-35B-A3B-MTP-GGUF:UD-Q4_K_XL --spec-type draft-mtp --spec-draft-n-max 6
  • py Unsloth Studio 图形界面直接运行 MTP 模型
对位
对位 Qwen3.5-35B-A3B、Gemma4-26B-A4B
适合
本地多模态推理与编程代理 (MTP加速) / 视觉问答、文档理解与工具调用
不适合
要求原始精度的量化敏感场景
规模
35B (3B active, Q4_K_XL) · 262k (可扩展至1M) · Apache-2.0
框架
llama.cpp / ollama / Unsloth Studio
可信度
HuggingFace 23.7万下载,Qwen官方Apache-2.0,Unsloth提供原生MTP GGUF量化

今日观察 (0)

今日无观察。

← 前一日 2026-05-18 · 后一日 不可用 (已是最新)