GLM 4.6
MoEGLM
Zhipu の357B MoE モデルです。API 経由で$0.6/Mトークン。ローカル展開には8×H200 または同等のマルチ GPU 環境と vLLM v0.19+ が必要です。コンシューマー GPU での動作は想定されていません。
提供元
Zhipu AI
パラメータ
357B
コンテキスト
128K
リリース
2026-04-08
量子化別 VRAM 要件
| 量子化 | ディスク容量 | 必要VRAM | 対応GPU |
|---|---|---|---|
| Q4_K_M | 180 GB | 195 GB | 0 GPU |
| Q2_K | 95 GB | 105 GB | 0 GPU |
ベンチマークスコア
mmlu85.5%
humaneval86%
スコアは目安であり、量子化レベルにより変動します。
HuggingFace
zai-org/GLM-4.6