runlocal.cc
GPUを診断 →

GLM 4.6

MoEGLM

Zhipu の357B MoE モデルです。API 経由で$0.6/Mトークン。ローカル展開には8×H200 または同等のマルチ GPU 環境と vLLM v0.19+ が必要です。コンシューマー GPU での動作は想定されていません。

提供元

Zhipu AI

パラメータ

357B

コンテキスト

128K

リリース

2026-04-08

量子化別 VRAM 要件

量子化ディスク容量必要VRAM対応GPU
Q4_K_M180 GB195 GB0 GPU
Q2_K95 GB105 GB0 GPU

ベンチマークスコア

mmlu85.5%
humaneval86%

スコアは目安であり、量子化レベルにより変動します。

HuggingFace

zai-org/GLM-4.6

HFで見る →