runlocal.cc
GPUを診断 →

micro-kiki v3

MoEApache 2.0

Qwen 3.5 35B-A3B をベースに、35種類のドメイン LoRA エキスパートと自動ルーターを搭載したモデルです。Aeon 長期記憶を備えた組み込みエンジニアリング特化モデルです。FineFab 上で構築された、完全オープンソースの LoRA ルーティング参照実装です。

提供元

L'Électron Rare

パラメータ

3B active / 35B total (MoE + 35 LoRAs)

コンテキスト

131.072K

リリース

2026-04-18

量子化別 VRAM 要件

量子化ディスク容量必要VRAM対応GPU
Q4_K_M19.5 GB21 GB9 GPU
Q4_018.5 GB20 GB9 GPU
Q2_K11.5 GB13 GB16 GPU

ベンチマークスコア

mmlu83%
humaneval87%

スコアは目安であり、量子化レベルにより変動します。

対応GPU (16)

HuggingFace

LElectronRare/micro-kiki-v3

HFで見る →