GPUを診断 →

← 全モデル

Zyphra ZAYA1-8B

MoEApache 2.0

AMD GPU で訓練されたコンパクトな推論チューニング MoE モデルで、パラメーターあたりの知性密度を最適化しています。Q4 量子化で12GB のシングルカードに収まります。

提供元

Zyphra AI

パラメータ

8B (MoE)

コンテキスト

65.536K

リリース

2026-05-04

量子化別 VRAM 要件

量子化	ディスク容量	必要VRAM	対応GPU
Q8_0	8.5 GB	9.5 GB	18 GPU
Q4_K_M	4.8 GB	6 GB	19 GPU
Q4_0	4.5 GB	5.6 GB	19 GPU

Ollama でインストール

ターミナルで実行:

ollama pull zaya1:8b

最低 VRAM 5.6GB が必要です。Ollama は以下からインストール: ollama.com

ベンチマークスコア

mmlu73.5%

humaneval68%

スコアは目安であり、量子化レベルにより変動します。

対応GPU (19)

AMD RX 9070 XT (16GB)AMD RX 7900 GRE (16GB)AMD RX 7900 XTX (24GB)AMD Ryzen AI Max+ 395 (unified memory) (64GB)Apple M4 Pro (24GB) (24GB)Apple M3 Max (36GB) (36GB)Apple M4 Max (48GB) (48GB)Apple M4 Ultra (64GB) (64GB)NVIDIA RTX 4060 (8GB)NVIDIA RTX 3080 12GB (12GB)NVIDIA RTX 4070 SUPER (12GB)NVIDIA RTX 4070 Ti SUPER (16GB)NVIDIA RTX 4080 SUPER (16GB)NVIDIA RTX 5070 Ti (16GB)NVIDIA RTX 4060 Ti 16GB (16GB)NVIDIA RTX 5080 (16GB)NVIDIA RTX 4090 (24GB)NVIDIA RTX 3090 (24GB)NVIDIA RTX 5090 (32GB)

HuggingFace

Zyphra/ZAYA1-8B

HFで見る →