runlocal.cc
GPUを診断 →

Gemma 4 E2B

MoEApache 2.0

Google の超コンパクトなマルチモーダル MoE モデルです。アクティブパラメーターは2.3Bのみで、テキスト・画像・音声のフル対応を実現しています。Gemma 4 ファミリー中、最も低い VRAM で動作します。

提供元

Google

パラメータ

2.3B active / 5B total

コンテキスト

131.072K

リリース

2026-04-08

量子化別 VRAM 要件

量子化ディスク容量必要VRAM対応GPU
Q8_05 GB6 GB19 GPU
Q4_K_M2.8 GB3.5 GB19 GPU
Q4_02.6 GB3.2 GB19 GPU

Ollama でインストール

ターミナルで実行:

ollama pull gemma4:e2b

最低 VRAM 3.2GB が必要です。Ollama は以下からインストール: ollama.com

ベンチマークスコア

mmlu72%
humaneval52%

スコアは目安であり、量子化レベルにより変動します。

対応GPU (19)

HuggingFace

google/gemma-4-e2b-it

HFで見る →