DeepSeek V4 Pro
MoEDeepSeek
DeepSeek のフロンティア1.6T MoE モデルで、大規模 FP4 QAT を用いて訓練されています。独自の Hybrid Attention(CSA+HCA)と Manifold-Constrained Hyper-Connections を採用し、残差接続を置き換えています。API 経由で$1.74/$3.48 per Mトークン。ローカル実行には対応していません。
提供元
DeepSeek
パラメータ
862B active / 1.6T total (MoE)
コンテキスト
128K
リリース
2026-04-24
量子化別 VRAM 要件
| 量子化 | ディスク容量 | 必要VRAM | 対応GPU |
|---|---|---|---|
| BF16 (reference) | 2900 GB | 3100 GB | 0 GPU |
ベンチマークスコア
mmlu91%
humaneval93.5%
スコアは目安であり、量子化レベルにより変動します。
HuggingFace
deepseek-ai/DeepSeek-V4-Pro