runlocal.cc
GPUを診断 →

DeepSeek V4 Flash

MoEDeepSeek

V4 Pro の蒸留 Flash バリアントです。シンプルなエージェントタスクでは Pro に近い性能を1/12のコスト($0.14/$0.28 per Mトークン)で実現します。ルーチンタスクにおけるV4 Pro との性能差はほぼゼロです。コンシューマー向けハードウェアでのローカル実行には対応していません。

提供元

DeepSeek

パラメータ

158B active / 292B total (MoE)

コンテキスト

128K

リリース

2026-04-24

量子化別 VRAM 要件

量子化ディスク容量必要VRAM対応GPU
BF16 (reference)530 GB580 GB0 GPU
Q4_K_M (est.)165 GB180 GB0 GPU

ベンチマークスコア

mmlu88%
humaneval90%

スコアは目安であり、量子化レベルにより変動します。

HuggingFace

deepseek-ai/DeepSeek-V4-Flash

HFで見る →