runlocal weekly
毎週、新しいモデルリリース、ベンチマーク比較、ハードウェアの知見、Ollama ガイドをお届け。ローカルでAIを動かす開発者のためのニュースレター。
いつでも解除可能。広告なし。シグナルのみ。
新リリース
Qwen 3.6、Gemma 4、GLM-5
ベンチマーク
VRAM 17GB で精度 88%
セットアップ
Claude Code + Ollama、Pi 5 RAG
最新号
全ての記事 →FLUX 級の 4B 画像モデルを 1.21 GB に圧縮 — しかもブラウザで動く
PrismML の Bonsai Image は、FLUX.2 派生の diffusion transformer を sub-2-bit まで量子化し、MLX・CUDA・WebGPU・iPhone 向けビルドを揃えた。フットプリントと速度は本物だが、品質の代償もまた本物だ。公式数値ベースの正直なトレードオフを示す(自前ベンチマークは追って計測)。
Claude が出した『Agent Skills』、r/LocalLLaMA は1ヶ月前に正準4本を書いていた
plan-first / test-first / refactor-with-constraint / debug-loop。すべてのローカル LLM コーディングエージェントが標準搭載すべき4つの skill ファイル ── Qwen3.6 27B を本当に daily driver にしたスレッドから抽出。
Stop trying to use Cline locally. r/LocalLLaMA's real answer for daily-driving Qwen3.6 27B + MTP.
Cloud agents fall apart on local models. Three scaffold-first tools the community is actually shipping with — SmallCode, PI Coding Agent, and little-coder — plus a decision matrix by VRAM.