归档 · 2026-05-16

归档 / 2026-05-16

今日推荐 (7)

OmniVoice (k2-fsa)

为开发者提供600+语言零样本语音合成

部署

pip pip install omnivoice
url HF Space: https://huggingface.co/spaces/k2-fsa/OmniVoice
url Colab: https://colab.research.google.com/github/k2-fsa/OmniVoice/blob/master/docs/OmniVoice.ipynb

对位: 对位 XTTS-v2、Fish Audio
适合: 全球多语种语音合成与声音克隆 / 创意声音设计与非语言符号表达
不适合: 实时流式对话系统
规模: 未知 · 不适用 · apache-2.0
框架: omnivoice
可信度: 下载量超 208 万，论文 arXiv:2604.00688，910 点赞

Supertonic 3 (Supertone)

31种语言本地TTS，面向AI应用开发者的语音合成

部署

pip pip install supertonic
url HF Space: https://huggingface.co/spaces/Supertone/supertonic-3

对位: 对比VoxCPM2等大模型，更小尺寸本地运行
适合: 多语言离线语音合成 / 低资源设备端实时TTS
不适合: 语音克隆与高拟真度需求
规模: 99M · 未知 · OpenRAIL-M
框架: ONNX Runtime / supertonic
可信度: 16k下载，258赞，99M参数ONNX模型，支持31语言

DeepSeek-V4-Pro (DeepSeek)

1.6T参数MoE模型,1M上下文,含推理模式

已量化

部署

py transformers.AutoModelForCausalLM.from_pretrained('deepseek-ai/DeepSeek-V4-Pro')
url ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V4-Pro

对位: 对位 GPT-5.4 xHigh, Claude Opus 4.6 Max
适合: 1M 长文本分析与综合 / 高难度代码与数学竞赛
不适合: 低延迟日常闲聊
规模: 1.6T (49B 激活) · 1M · MIT
框架: transformers
可信度: HuggingFace 月下载 296 万, 点赞 3983

Qwen3.6-40B (DavidAU)

多模态无审查推理模型，面向代码与视觉应用

部署

hf huggingface-cli download DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF --include '*.gguf' --local-dir .
py llama-cli -m <gguf-file> -p '你的提示'

对位: Qwen 官方模型的无审查替代版
适合: 无审查代码生成与推理 / 多模态图像理解
不适合: 需要内容过滤的生产场景
规模: 40B · 未知 · unknown
框架: llama.cpp / ollama
可信度: HuggingFace 总下载 207k，点赞 94

Sulphur-2-base (SulphurAI)

无审查文本/图像生成视频，基于LTX2.3

部署

py diffusers.from_pretrained('SulphurAI/Sulphur-2-base')
py lmstudio load gguf + mmproj for prompt enhancer

对位: 对位原始LTX-Video 2.3
适合: 无审查视频生成 / 图像转视频二次创作
不适合: 需安全审查的商业应用
规模: 22B · 未知 · unknown
框架: diffusers
可信度: HuggingFace 下载量 875k，点赞 1k

Z-Anime (SeeSee21)

动漫风格图像生成，面向二次元AI应用开发者

部署

hf huggingface-cli download SeeSee21/Z-Anime
py from diffusers import StableDiffusionPipeline; pipe = StableDiffusionPipeline.from_pretrained('SeeSee21/Z-Anime')

对位: 对位 Anything-V5、Counterfeit 等动漫模型
适合: 生成动漫风格插画 / 二次元角色设计
不适合: 写实照片生成
规模: 4B · 未知 · unknown
框架: diffusers / comfyui
可信度: Hugging Face 下载量 14,494，获赞 384

Leanly_AI (jackxinning)

通用问答模型，适合知识型对话与事实查询。

部署

py transformers: AutoModel.from_pretrained('jackxinning/Leanly_AI')

对位: 无明确对标，通用 QA 方案。
适合: 知识问答 / 事实查询
不适合: 复杂推理或创意生成
规模: 14B · 未知 · unknown
框架: transformers
可信度: HuggingFace 下载量 10,961，点赞 113。

今日观察 (7)

Nandi-Mini-600M (FrontiersMind)

观察

600M参数早期检查点，面向低资源多语言部署

部署

py transformers.from_pretrained('FrontiersMind/Nandi-Mini-600M-Early-Checkpoint')

对位: 对位 Qwen2.5-0.5B / SmolLM-360M
适合: 低内存/边缘设备部署 / 英印多语言文本生成
不适合: 生产环境或最终模型
规模: 600M · 2048 · apache-2.0
框架: transformers
可信度: 已训练250B tokens，8.3k下载，tokenization fertility优于同级模型

Dramabox (ResembleAI)

观察

通用文本转语音，面向配音与有声内容制作者

部署

hf huggingface-cli download ResembleAI/Dramabox
py snapshot_download('ResembleAI/Dramabox')

对位: 对位 Bark、XTTS-v2
适合: 多角色配音生成 / 有声书合成
不适合: 低延迟实时语音场景
规模: 未知 · 不适用 · unknown
框架: huggingface_hub
可信度: HuggingFace 下载量 869，点赞 96

Juggernaut-Z-Image (RunDiffusion)

观察

文本到图像扩散模型，面向 AI 应用构建者

部署

py diffusers: from_pretrained('RunDiffusion/Juggernaut-Z-Image')
py ComfyUI: Juggernaut 节点加载

对位: 对位 SDXL 系列及 Juggernaut 旧版
适合: 风格化视觉内容生成 / 集成到自动化绘图管线
不适合: 要求照片级真实感的生产任务
规模: 未公开 · 未公开 · unknown
框架: diffusers / comfyui
可信度: HuggingFace 下载 17k+，点赞 68，RunDiffusion 维护

scenema-audio (ScenemaAI)

观察

TTS 模型，面向语音合成开发者

部署

hf huggingface-cli download ScenemaAI/scenema-audio
py git clone https://huggingface.co/ScenemaAI/scenema-audio

对位: 对位 Bark、VITS 等 TTS 方案
适合: 文本转语音合成 / AI 语音内容制作
不适合: 高并发实时语音服务
规模: 未公开 · 未知 · unknown
框架: 未公开
可信度: Hugging Face 下载量 176，点赞 65

Qwen3.6-35B-A3B-Uncensored-Aggressive (HauhauCS)

观察

35B MoE 多模态去审查版，创意写作与视觉应用

部署

py llama-cli -m Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive-Q4_K_P.gguf --mmproj mmproj-f16.gguf --jinja -c 131072 -ngl 99
py LM Studio 搜索 Qwen3.6-35B-A3B-Uncensored 直接下载
url 浏览器访问 https://huggingface.co/HauhauCS/Qwen3.6-35B-A3B-Uncensored-HauhauCS-Aggressive

对位: 替代原版 Qwen3.6-35B-A3B 审查版
适合: 生成无限制的创意文本与角色扮演 / 多模态视觉问答与图像理解
不适合: 内容安全敏感的线上服务
规模: 35B (3B active MoE) · 262k · Apache-2.0
框架: llama.cpp / LM Studio / koboldcpp
可信度: 132万下载, 646赞, 基于Qwen官方权重无损去审查, 0拒答

Sulphur-2-Base (vantagewithai)

观察

图像到视频基座模型，GGUF量化版，适合本地推理

部署

py llama.cpp -m Sulphur-2-Base-Q4_K_M.gguf
py ollama create sulphur2-base -f Modelfile && ollama run sulphur2-base

对位: 对位官方非量化 Sulphur-2-Base
适合: 本地图像到视频生成推理 / 低资源设备快速原型
不适合: 高分辨率长视频生成
规模: 未知 · 未知 · unknown
框架: llama.cpp / ollama
可信度: HuggingFace 下载量 52,477，44 点赞

Ring-2.6-1T (inclusionAI)

观察

万亿参数推理模型，面向Agent与复杂工作流

部署

py modelscope download inclusionAI/Ring-2.6-1T (魔搭下载)
py SGLang启动: sglang.launch_server --model-path $MODEL_PATH --tp 8 --pp 4 --trust-remote-code (需定制分支)

对位: 对位 GPT-5.4, Gemini-3.1-Pro, Claude-Opus-4.7
适合: Agent多步任务与工具调用 / 数学竞赛与复杂逻辑分析
不适合: 低延迟简单对话
规模: 1T · 128K (YaRN可扩展至256K) · MIT
框架: SGLang
可信度: HF 1.1k下载，PinchBench 87.6，AIME26 95.83，魔搭可下载

← 前一日不可用 · 后一日 2026-05-18 →