Edit Models filters

Model Tree

Apps

Docker Model Runner

Inference Providers

OVHcloud AI Endpoints

HF Inference API

Misc

Inference Endpoints

text-generation-inference

Eval Results (legacy)

text-embeddings-inference

4-bit precision

8-bit precision

Mixture of Experts

Carbon Emissions

Models

1,026

Base only

Active filters: nvfp4

AEON-7/Ornith-1.0-35B-AEON-Ultimate-Uncensored-NVFP4

Text Generation • 21B • Updated 5 days ago • 8.68k • 39

nvidia/MiniMax-M3-NVFP4

Text Generation • 247B • Updated 7 days ago • 43.3k • 47

nvidia/Mistral-Medium-3.5-128B-NVFP4

Text Generation • 84B • Updated 2 days ago • 2.22k • 18

s-batman/Ornith-1.0-35B-NVFP4-MTP-GGUF

Text Generation • 36B • Updated 5 days ago • 28.6k • 21

0xSero/GLM-5.2-504B-Nvidia

Text Generation • 293B • Updated 7 days ago • 785 • 19

nvidia/Gemma-4-26B-A4B-NVFP4

Text Generation • 14B • Updated May 11 • 2.2M • 108

0xSero/GLM-5.2-504B

Text Generation • 290B • Updated 8 days ago • 18k • 29

williamliao/Qwen3.6-27B-NVFP4-GGUF

Text Generation • 27B • Updated 3 days ago • 1.79k • 11

nvidia/DeepSeek-V4-Flash-NVFP4

Text Generation • 167B • Updated 19 days ago • 360k • 56

LordNeel/Agents-A1-GGUF

Text Generation • 35B • Updated 3 days ago • 7.49k • 8

CodeFault/Nvidia-Qwen3.6-27B-NVFP4-GGUF

Text Generation • 27B • Updated 3 days ago • 449 • 8

sakamakismile/Ornith-1.0-35B-NVFP4

Image-Text-to-Text • 20B • Updated 8 days ago • 27k • 13

Winnougan/LTX-2.3-INT8

Updated 6 days ago • 16

michaelw9999/Qwen3.6-27B-NVFP4-MTP-GGUF

27B • Updated 27 days ago • 65.2k • 36

saricles/MiniMax-M2.7-REAP-172B-A10B-NVFP4-GB10

Text Generation • 87B • Updated Apr 19 • 4.7k • 32

nvidia/Qwen3.5-122B-A10B-NVFP4

Text Generation • 65B • Updated Jun 2 • 63.6k • 28

nvidia/DeepSeek-V4-Pro-NVFP4

Text Generation • 910B • Updated 20 days ago • 158k • 68

rdtand/Qwen3.6-27B-PrismaAURA-5.5bit-vllm

20B • Updated 9 days ago • 7.79k • 13

sakamakismile/Qwen-AgentWorld-35B-A3B-NVFP4

Text Generation • 20B • Updated 9 days ago • 1.36k • 6

Jiunsong/SuperQwen-AgentWorld-35B-A3B-abliterated-nvf4

Text Generation • 35B • Updated 8 days ago • 553 • 4

utautako/Qwen3.6-27B-NVIDIA-NVFP4-MTP-GGUF

Image-Text-to-Text • 0.5B • Updated about 23 hours ago • 2.79k • 4

AEON-7/Qwen3.6-35B-A3B-heretic-NVFP4

Image-Text-to-Text • 21B • Updated 6 days ago • 238k • 55

cyburn/Qwopus3.6-35B-A3B-v1-PrismaSCOUT-Blackwell-NVFP4-BF16-vllm-4.75bits

Image-Text-to-Text • 21B • Updated May 7 • 4.48k • 9

nvidia/diffusiongemma-26B-A4B-it-NVFP4

Text Generation • 14B • Updated 23 days ago • 1.37M • 90

madeby561/GLM-5.2-NVFP4-REAP-504B-term

Text Generation • 290B • Updated 3 days ago • 1.84k • 16

DJLougen/Qwable-5-27B-Coder-NVFP4

Text Generation • 15B • Updated 10 days ago • 785 • 10

iggerask/DeepSeek-V4-Flash-2bit-GB10

Text Generation • 5B • Updated 10 days ago • 1.2k • 3

sakamakismile/Krea-2-Turbo-NVFP4-AWQ

Text-to-Image • Updated 8 days ago • 136 • 3

nerkyor/Qwen3.6-27B-DSV4Pro-Thinking-Distill-NVFP4

Text Generation • 19B • Updated 6 days ago • 286 • 3

mudler/Qwen3.6-35B-A3B-NVFP4-GGUF

Text Generation • 36B • Updated 7 days ago • 1.3k • 3