Llama 4 Scout

MoELlama 4

Meta の効率的な MoE モデルで、前例のない1000万トークンコンテキストウィンドウを備えています。総パラメーター数109Bのうち、17Bをアクティブ状態で使用します。

提供元

量子化別 VRAM 要件

量子化	ディスク容量	必要VRAM	対応GPU
Q4_K_M	53 GB	58 GB	2 GPU
Q4_0	50 GB	55 GB	2 GPU
Q2_K	32 GB	35 GB	3 GPU

ターミナルで実行:

ollama pull llama4:scout

最低 VRAM 35GB が必要です。Ollama は以下からインストール: ollama.com

mmlu79.8%

humaneval75.3%

スコアは目安であり、量子化レベルにより変動します。

HuggingFace

meta-llama/Llama-4-Scout-17B-16E