Llama 4 Scout
MoELlama 4
Meta の効率的な MoE モデルで、前例のない1000万トークンコンテキストウィンドウを備えています。総パラメーター数109Bのうち、17Bをアクティブ状態で使用します。
提供元
Meta
パラメータ
17B active (109B total MoE)
コンテキスト
10,485.76K
リリース
2026-04-05
量子化別 VRAM 要件
| 量子化 | ディスク容量 | 必要VRAM | 対応GPU |
|---|---|---|---|
| Q4_K_M | 53 GB | 58 GB | 2 GPU |
| Q4_0 | 50 GB | 55 GB | 2 GPU |
| Q2_K | 32 GB | 35 GB | 3 GPU |
Ollama でインストール
ベンチマークスコア
mmlu79.8%
humaneval75.3%
スコアは目安であり、量子化レベルにより変動します。
対応GPU (3)
HuggingFace
meta-llama/Llama-4-Scout-17B-16E