Gemma 4 E2B

MoEApache 2.0

Google's ultra-compact multimodal MoE. Only 2.3B active params with full text/image/audio support. Lowest VRAM entry point in the Gemma 4 family.

Provider

Google

Parameters

2.3B active / 5B total

Context

131.072K

Released

2026-04-08

VRAM Requirements by Quantization

Method	Disk Size	VRAM Required	Fits GPUs
Q8_0	5 GB	6 GB	19 GPUs
Q4_K_M	2.8 GB	3.5 GB	19 GPUs
Q4_0	2.6 GB	3.2 GB	19 GPUs

Run in terminal:

ollama pull gemma4:e2b

Minimum 3.2GB VRAM required. Install Ollama from ollama.com

mmlu72%

humaneval52%

Scores are approximate and may vary by quantization level.

HuggingFace

google/gemma-4-e2b-it