runlocal.cc
GPUを診断 →

Llama 4 Scout

MoELlama 4

Meta の効率的な MoE モデルで、前例のない1000万トークンコンテキストウィンドウを備えています。総パラメーター数109Bのうち、17Bをアクティブ状態で使用します。

提供元

Meta

パラメータ

17B active (109B total MoE)

コンテキスト

10,485.76K

リリース

2026-04-05

量子化別 VRAM 要件

量子化ディスク容量必要VRAM対応GPU
Q4_K_M53 GB58 GB2 GPU
Q4_050 GB55 GB2 GPU
Q2_K32 GB35 GB3 GPU

Ollama でインストール

ターミナルで実行:

ollama pull llama4:scout

最低 VRAM 35GB が必要です。Ollama は以下からインストール: ollama.com

ベンチマークスコア

mmlu79.8%
humaneval75.3%

スコアは目安であり、量子化レベルにより変動します。

対応GPU (3)

HuggingFace

meta-llama/Llama-4-Scout-17B-16E

HFで見る →