GLM 5
MoEGLM
Zhipu の744B フロンティア MoE モデルです。API 経由で$1.0/Mトークン。クラスタースケールの展開のみ対応。積極的な量子化でも200GB+ VRAM が必要です。
提供元
Zhipu AI
パラメータ
744B
コンテキスト
128K
リリース
2026-04-08
量子化別 VRAM 要件
| 量子化 | ディスク容量 | 必要VRAM | 対応GPU |
|---|---|---|---|
| Q4_K_M | 370 GB | 400 GB | 0 GPU |
| Q2_K | 195 GB | 215 GB | 0 GPU |
ベンチマークスコア
mmlu87%
humaneval89.5%
スコアは目安であり、量子化レベルにより変動します。
HuggingFace
zai-org/GLM-5