GPUを診断 →

← 全モデル

Gemma 4 E4B

MoEGemma

Google の効率的な4Bアクティブ MoE モデルです。計算リソースあたりの性能が優れており、一般的なコンシューマー向けハードウェアで動作します。

提供元

Google

パラメータ

4B active (MoE)

コンテキスト

128K

リリース

2026-04-08

量子化別 VRAM 要件

量子化	ディスク容量	必要VRAM	対応GPU
Q8_0	4.5 GB	5.5 GB	19 GPU
Q4_K_M	2.6 GB	3.5 GB	19 GPU
Q4_0	2.5 GB	3.2 GB	19 GPU

Ollama でインストール

ターミナルで実行:

ollama pull gemma4:e4b

最低 VRAM 3.2GB が必要です。Ollama は以下からインストール: ollama.com

ベンチマークスコア

mmlu74.2%

humaneval68.5%

スコアは目安であり、量子化レベルにより変動します。

対応GPU (19)

AMD RX 9070 XT (16GB)AMD RX 7900 GRE (16GB)AMD RX 7900 XTX (24GB)AMD Ryzen AI Max+ 395 (unified memory) (64GB)Apple M4 Pro (24GB) (24GB)Apple M3 Max (36GB) (36GB)Apple M4 Max (48GB) (48GB)Apple M4 Ultra (64GB) (64GB)NVIDIA RTX 4060 (8GB)NVIDIA RTX 3080 12GB (12GB)NVIDIA RTX 4070 SUPER (12GB)NVIDIA RTX 4070 Ti SUPER (16GB)NVIDIA RTX 4080 SUPER (16GB)NVIDIA RTX 5070 Ti (16GB)NVIDIA RTX 4060 Ti 16GB (16GB)NVIDIA RTX 5080 (16GB)NVIDIA RTX 4090 (24GB)NVIDIA RTX 3090 (24GB)NVIDIA RTX 5090 (32GB)

HuggingFace

google/gemma-4-e4b-it

HFで見る →