runlocal.cc
GPUを診断 →

Zyphra ZAYA1-8B

MoEApache 2.0

AMD GPU で訓練されたコンパクトな推論チューニング MoE モデルで、パラメーターあたりの知性密度を最適化しています。Q4 量子化で12GB のシングルカードに収まります。

提供元

Zyphra AI

パラメータ

8B (MoE)

コンテキスト

65.536K

リリース

2026-05-04

量子化別 VRAM 要件

量子化ディスク容量必要VRAM対応GPU
Q8_08.5 GB9.5 GB18 GPU
Q4_K_M4.8 GB6 GB19 GPU
Q4_04.5 GB5.6 GB19 GPU

Ollama でインストール

ターミナルで実行:

ollama pull zaya1:8b

最低 VRAM 5.6GB が必要です。Ollama は以下からインストール: ollama.com

ベンチマークスコア

mmlu73.5%
humaneval68%

スコアは目安であり、量子化レベルにより変動します。

対応GPU (19)

HuggingFace

Zyphra/ZAYA1-8B

HFで見る →