runlocal.cc
GPUを診断 →

Gemma 4 E4B

MoEGemma

Google の効率的な4Bアクティブ MoE モデルです。計算リソースあたりの性能が優れており、一般的なコンシューマー向けハードウェアで動作します。

提供元

Google

パラメータ

4B active (MoE)

コンテキスト

128K

リリース

2026-04-08

量子化別 VRAM 要件

量子化ディスク容量必要VRAM対応GPU
Q8_04.5 GB5.5 GB19 GPU
Q4_K_M2.6 GB3.5 GB19 GPU
Q4_02.5 GB3.2 GB19 GPU

Ollama でインストール

ターミナルで実行:

ollama pull gemma4:e4b

最低 VRAM 3.2GB が必要です。Ollama は以下からインストール: ollama.com

ベンチマークスコア

mmlu74.2%
humaneval68.5%

スコアは目安であり、量子化レベルにより変動します。

対応GPU (19)

HuggingFace

google/gemma-4-e4b-it

HFで見る →