runlocal.cc
GPUを診断 →

Gemma 4 26B-A4B

MoEGemma

26Bプールから4Bをアクティブに使用する Gemma 4 MoE バリアントです。Unsloth が22段階の量子化レベルでクラス最高の GGUF を達成しており、Gemma 4 ファミリー中で最も幅広い量子化カバレッジを提供します。

提供元

Google DeepMind

パラメータ

26B (4B active MoE)

コンテキスト

128K

リリース

2026-04-20

量子化別 VRAM 要件

量子化ディスク容量必要VRAM対応GPU
Q8_027 GB29 GB5 GPU
Q4_K_M15 GB16.5 GB9 GPU
Q4_014.3 GB15.5 GB9 GPU
Q2_K9 GB10.5 GB18 GPU

Ollama でインストール

ターミナルで実行:

ollama pull gemma4:26b-a4b

最低 VRAM 10.5GB が必要です。Ollama は以下からインストール: ollama.com

ベンチマークスコア

mmlu83%
humaneval80.5%

スコアは目安であり、量子化レベルにより変動します。

対応GPU (18)

HuggingFace

google/gemma-4-26b-a4b-it

HFで見る →