归档 / 2026-05-16

今日推荐 (7)

推荐

为开发者提供600+语言零样本语音合成

部署
对位
对位 XTTS-v2、Fish Audio
适合
全球多语种语音合成与声音克隆 / 创意声音设计与非语言符号表达
不适合
实时流式对话系统
规模
未知 · 不适用 · apache-2.0
框架
omnivoice
可信度
下载量超 208 万,论文 arXiv:2604.00688,910 点赞
推荐

31种语言本地TTS,面向AI应用开发者的语音合成

部署
对位
对比VoxCPM2等大模型,更小尺寸本地运行
适合
多语言离线语音合成 / 低资源设备端实时TTS
不适合
语音克隆与高拟真度需求
规模
99M · 未知 · OpenRAIL-M
框架
ONNX Runtime / supertonic
可信度
16k下载,258赞,99M参数ONNX模型,支持31语言
推荐

1.6T参数MoE模型,1M上下文,含推理模式

部署
对位
对位 GPT-5.4 xHigh, Claude Opus 4.6 Max
适合
1M 长文本分析与综合 / 高难度代码与数学竞赛
不适合
低延迟日常闲聊
规模
1.6T (49B 激活) · 1M · MIT
框架
transformers
可信度
HuggingFace 月下载 296 万, 点赞 3983
推荐

多模态无审查推理模型,面向代码与视觉应用

部署
  • hf huggingface-cli download DavidAU/Qwen3.6-40B-Claude-4.6-Opus-Deckard-Heretic-Uncensored-Thinking-NEO-CODE-Di-IMatrix-MAX-GGUF --include '*.gguf' --local-dir .
  • py llama-cli -m <gguf-file> -p '你的提示'
对位
Qwen 官方模型的无审查替代版
适合
无审查代码生成与推理 / 多模态图像理解
不适合
需要内容过滤的生产场景
规模
40B · 未知 · unknown
框架
llama.cpp / ollama
可信度
HuggingFace 总下载 207k,点赞 94
推荐

无审查文本/图像生成视频,基于LTX2.3

部署
  • py diffusers.from_pretrained('SulphurAI/Sulphur-2-base')
  • py lmstudio load gguf + mmproj for prompt enhancer
对位
对位原始LTX-Video 2.3
适合
无审查视频生成 / 图像转视频二次创作
不适合
需安全审查的商业应用
规模
22B · 未知 · unknown
框架
diffusers
可信度
HuggingFace 下载量 875k,点赞 1k
推荐

动漫风格图像生成,面向二次元AI应用开发者

部署
  • hf huggingface-cli download SeeSee21/Z-Anime
  • py from diffusers import StableDiffusionPipeline; pipe = StableDiffusionPipeline.from_pretrained('SeeSee21/Z-Anime')
对位
对位 Anything-V5、Counterfeit 等动漫模型
适合
生成动漫风格插画 / 二次元角色设计
不适合
写实照片生成
规模
4B · 未知 · unknown
框架
diffusers / comfyui
可信度
Hugging Face 下载量 14,494,获赞 384
推荐

通用问答模型,适合知识型对话与事实查询。

部署
  • py transformers: AutoModel.from_pretrained('jackxinning/Leanly_AI')
对位
无明确对标,通用 QA 方案。
适合
知识问答 / 事实查询
不适合
复杂推理或创意生成
规模
14B · 未知 · unknown
框架
transformers
可信度
HuggingFace 下载量 10,961,点赞 113。

今日观察 (7)

观察

600M参数早期检查点,面向低资源多语言部署

部署
  • py transformers.from_pretrained('FrontiersMind/Nandi-Mini-600M-Early-Checkpoint')
对位
对位 Qwen2.5-0.5B / SmolLM-360M
适合
低内存/边缘设备部署 / 英印多语言文本生成
不适合
生产环境或最终模型
规模
600M · 2048 · apache-2.0
框架
transformers
可信度
已训练250B tokens,8.3k下载,tokenization fertility优于同级模型
观察

通用文本转语音,面向配音与有声内容制作者

部署
  • hf huggingface-cli download ResembleAI/Dramabox
  • py snapshot_download('ResembleAI/Dramabox')
对位
对位 Bark、XTTS-v2
适合
多角色配音生成 / 有声书合成
不适合
低延迟实时语音场景
规模
未知 · 不适用 · unknown
框架
huggingface_hub
可信度
HuggingFace 下载量 869,点赞 96
观察

文本到图像扩散模型,面向 AI 应用构建者

部署
  • py diffusers: from_pretrained('RunDiffusion/Juggernaut-Z-Image')
  • py ComfyUI: Juggernaut 节点加载
对位
对位 SDXL 系列及 Juggernaut 旧版
适合
风格化视觉内容生成 / 集成到自动化绘图管线
不适合
要求照片级真实感的生产任务
规模
未公开 · 未公开 · unknown
框架
diffusers / comfyui
可信度
HuggingFace 下载 17k+,点赞 68,RunDiffusion 维护
观察

TTS 模型,面向语音合成开发者

部署
  • hf huggingface-cli download ScenemaAI/scenema-audio
  • py git clone https://huggingface.co/ScenemaAI/scenema-audio
对位
对位 Bark、VITS 等 TTS 方案
适合
文本转语音合成 / AI 语音内容制作
不适合
高并发实时语音服务
规模
未公开 · 未知 · unknown
框架
未公开
可信度
Hugging Face 下载量 176,点赞 65
观察

35B MoE 多模态去审查版,创意写作与视觉应用

部署
对位
替代原版 Qwen3.6-35B-A3B 审查版
适合
生成无限制的创意文本与角色扮演 / 多模态视觉问答与图像理解
不适合
内容安全敏感的线上服务
规模
35B (3B active MoE) · 262k · Apache-2.0
框架
llama.cpp / LM Studio / koboldcpp
可信度
132万下载, 646赞, 基于Qwen官方权重无损去审查, 0拒答
观察

图像到视频基座模型,GGUF量化版,适合本地推理

部署
  • py llama.cpp -m Sulphur-2-Base-Q4_K_M.gguf
  • py ollama create sulphur2-base -f Modelfile && ollama run sulphur2-base
对位
对位官方非量化 Sulphur-2-Base
适合
本地图像到视频生成推理 / 低资源设备快速原型
不适合
高分辨率长视频生成
规模
未知 · 未知 · unknown
框架
llama.cpp / ollama
可信度
HuggingFace 下载量 52,477,44 点赞
观察

万亿参数推理模型,面向Agent与复杂工作流

部署
  • py modelscope download inclusionAI/Ring-2.6-1T (魔搭下载)
  • py SGLang启动: sglang.launch_server --model-path $MODEL_PATH --tp 8 --pp 4 --trust-remote-code (需定制分支)
对位
对位 GPT-5.4, Gemini-3.1-Pro, Claude-Opus-4.7
适合
Agent多步任务与工具调用 / 数学竞赛与复杂逻辑分析
不适合
低延迟简单对话
规模
1T · 128K (YaRN可扩展至256K) · MIT
框架
SGLang
可信度
HF 1.1k下载,PinchBench 87.6,AIME26 95.83,魔搭可下载

← 前一日 不可用 · 后一日 2026-05-18 →