GPUを診断 →

← 全モデル

DeepSeek V4 Pro

MoEDeepSeek

DeepSeek のフロンティア1.6T MoE モデルで、大規模 FP4 QAT を用いて訓練されています。独自の Hybrid Attention（CSA+HCA）と Manifold-Constrained Hyper-Connections を採用し、残差接続を置き換えています。API 経由で$1.74/$3.48 per Mトークン。ローカル実行には対応していません。

提供元

DeepSeek

パラメータ

862B active / 1.6T total (MoE)

コンテキスト

128K

リリース

2026-04-24

量子化別 VRAM 要件

量子化	ディスク容量	必要VRAM	対応GPU
BF16 (reference)	2900 GB	3100 GB	0 GPU

ベンチマークスコア

mmlu91%

humaneval93.5%

スコアは目安であり、量子化レベルにより変動します。

HuggingFace

deepseek-ai/DeepSeek-V4-Pro

HFで見る →