DeepSeek V4 Flash
MoEDeepSeek
V4 Pro の蒸留 Flash バリアントです。シンプルなエージェントタスクでは Pro に近い性能を1/12のコスト($0.14/$0.28 per Mトークン)で実現します。ルーチンタスクにおけるV4 Pro との性能差はほぼゼロです。コンシューマー向けハードウェアでのローカル実行には対応していません。
提供元
DeepSeek
パラメータ
158B active / 292B total (MoE)
コンテキスト
128K
リリース
2026-04-24
量子化別 VRAM 要件
| 量子化 | ディスク容量 | 必要VRAM | 対応GPU |
|---|---|---|---|
| BF16 (reference) | 530 GB | 580 GB | 0 GPU |
| Q4_K_M (est.) | 165 GB | 180 GB | 0 GPU |
ベンチマークスコア
mmlu88%
humaneval90%
スコアは目安であり、量子化レベルにより変動します。
HuggingFace
deepseek-ai/DeepSeek-V4-Flash