runlocal.cc
GPUを診断 →

GLM 5

MoEGLM

Zhipu の744B フロンティア MoE モデルです。API 経由で$1.0/Mトークン。クラスタースケールの展開のみ対応。積極的な量子化でも200GB+ VRAM が必要です。

提供元

Zhipu AI

パラメータ

744B

コンテキスト

128K

リリース

2026-04-08

量子化別 VRAM 要件

量子化ディスク容量必要VRAM対応GPU
Q4_K_M370 GB400 GB0 GPU
Q2_K195 GB215 GB0 GPU

ベンチマークスコア

mmlu87%
humaneval89.5%

スコアは目安であり、量子化レベルにより変動します。

HuggingFace

zai-org/GLM-5

HFで見る →