支持MTP加速的3B激活参数量化视觉语言模型,面向本地编程代理
- 部署
-
- py llama-server -hf unsloth/Qwen3.6-35B-A3B-MTP-GGUF:UD-Q4_K_XL --spec-type draft-mtp --spec-draft-n-max 6
- py Unsloth Studio 图形界面直接运行 MTP 模型
最近 3 天 · 共 15 个推荐
支持MTP加速的3B激活参数量化视觉语言模型,面向本地编程代理
13B激活MoE,1M上下文,面向推理与代码
解禁版Qwen3.6-27B量化模型,为创意写作与代码而生
无审查Gemma 4 26B GGUF,适合苹果硅本地快速推理
像素空间文生图模型,基于AsymFlow,适合文字渲染与细节生成
多模态嵌入模型,支持文本/图像/视频/音频
Qwen3.6 MoE GGUF 量化版,用于本地代理编程与多模态推理
面向Agent编码与工具调用的9B视觉推理模型
为开发者提供600+语言零样本语音合成
31种语言本地TTS,面向AI应用开发者的语音合成
1.6T参数MoE模型,1M上下文,含推理模式
多模态无审查推理模型,面向代码与视觉应用
无审查文本/图像生成视频,基于LTX2.3
动漫风格图像生成,面向二次元AI应用开发者
通用问答模型,适合知识型对话与事实查询。