Edit Models filters

Inference Providers

HF Inference API

Misc

arxiv: 2407.14679

Inference Endpoints

AutoTrain Compatible

text-generation-inference

4-bit precision

Misc with no match

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

30

Full-text search

Active filters: 2407.14679

nvidia/Mistral-NeMo-Minitron-8B-Instruct

Text Generation • Updated Oct 9, 2024 • 3.64k • 74

nvidia/Minitron-4B-Base

Updated Aug 22, 2024 • 409 • 129

nvidia/Mistral-NeMo-Minitron-8B-Base

Text Generation • Updated Aug 22, 2024 • 15.9k • 170

nvidia/Nemotron-Mini-4B-Instruct

Updated Sep 23, 2024 • 95 • 148

nvidia/Minitron-8B-Base

Updated Aug 20, 2024 • 403 • 63

mgoin/Minitron-8B-Base-FP8

Text Generation • Updated Jul 26, 2024 • 11 • 3

mgoin/Nemotron-4-340B-Base-hf

Text Generation • Updated Aug 8, 2024 • 8 • 1

mgoin/Nemotron-4-340B-Base-hf-FP8

Text Generation • Updated Aug 8, 2024 • 69 • 2

nvidia/Llama-3.1-Minitron-4B-Width-Base

Updated Aug 22, 2024 • 10 • 187

nvidia/Llama-3.1-Minitron-4B-Depth-Base

Updated Aug 22, 2024 • 7 • 20

ThomasBaruzier/Llama-3.1-Minitron-4B-Width-Base-GGUF

Updated Aug 27, 2024 • 239 • 3

IntervitensInc/Llama-3.1-Minitron-4B-Width-Base-chatml

Updated Aug 26, 2024 • 16 • 2

QuantFactory/Mistral-NeMo-Minitron-8B-Base-GGUF

Updated Aug 21, 2024 • 353 • 5

QuantFactory/Llama-3.1-Minitron-4B-Depth-Base-GGUF

Updated Aug 22, 2024 • 46 • 1

RichardErkhov/nvidia_-_Mistral-NeMo-Minitron-8B-Base-gguf

Updated Aug 23, 2024 • 9.22k • 1

denkijin/Llama-3.1-Minitron-4B-Width-Base

Updated Aug 23, 2024

QuantFactory/Llama-3.1-Minitron-4B-Width-Base-GGUF

Updated Aug 24, 2024 • 102 • 1

QuantFactory/Minitron-4B-Base-GGUF

Updated Aug 24, 2024 • 23 • 1

QuantFactory/Minitron-8B-Base-GGUF

Updated Aug 24, 2024 • 34 • 1

TitanML/Mistral-NeMo-Minitron-8B-Base

Text Generation • Updated Sep 9, 2024 • 4

abiks/Nemotron-Mini-4B-Instruct-GGUF-Q8

Updated Sep 14, 2024 • 6 • 3

mylesgoose/Llama-3.1-Minitron-4B-Width-Base

Updated Sep 26, 2024 • 1 • 1

QuantFactory/Nemotron-Mini-4B-Instruct-GGUF

Updated Sep 24, 2024 • 2.14k • 2

QuantFactory/Mistral-NeMo-Minitron-8B-Instruct-GGUF

Updated Oct 4, 2024 • 252 • 5

lucyknada/nvidia_Mistral-NeMo-Minitron-8B-Instruct-v3-exl2

Updated Oct 4, 2024

mav23/Mistral-NeMo-Minitron-8B-Instruct-GGUF

Updated Oct 7, 2024 • 36 • 1

mav23/Mistral-NeMo-Minitron-8B-Base-GGUF

Updated Nov 5, 2024 • 47

da-fr/Mistral-NeMo-Minitron-8B-ARChitects-Full-bnb-4bit

Updated Dec 3, 2024 • 1.44k • 2

duyntnet/Nemotron-Mini-4B-Instruct-imatrix-GGUF

Text Generation • Updated Dec 5, 2024 • 185

duyntnet/Mistral-NeMo-Minitron-8B-Instruct-imatrix-GGUF

Text Generation • Updated Dec 12, 2024 • 89