Issue #82026年5月20日

AI coding agents compared (2026): Claude Code vs Cursor vs OpenCode vs OpenClaw vs Gemini CLI vs Cluely vs z.ai — and the best local models on Ollama

Seven cloud agents, four local models, one decision matrix. Pricing, underlying models, benchmark numbers, and the cases where each one is the right pick.

2026年において「唯一の最強コーディングエージェント」は存在しません。予算帯・プライバシーポリシー・モデルの好みに合ったツールを選ぶことが重要です。このページでは比較マトリクス、数値データ、各ティアのローカル代替案を提供します。

30秒で分かる結論

こんな方には…	おすすめ
コストを問わず最高の推論能力が欲しい	Claude Code（Anthropic Max）
最高のIDE統合体験	Cursor
オープンソースのCLI、ターミナル優先	OpenCode
オープンソースエージェント＋ローカルモデル＋チャットUI	OpenClaw + Ollama
Googleアカウントで無料利用	Gemini CLI
どのアプリでも使えるフローティングオーバーレイ	Cluely
最安の有料プランで強力なクラウドモデルを使いたい	z.ai（GLM）コーディングプラン
完全オフライン／テレメトリなし	OpenClaw または OpenCode + Ollama

以降のページで各選択の根拠を解説します。

なぜ今この比較が必要なのか

2026年に起きた2つの構造的変化により、多くの開発者がコーディングスタックを見直すことになりました。

Anthropic がサードパーティの Claude ラッパーを制限（2026年4月）。 Claude Pro/Maxを使っていたOpenClawおよびOpenCodeのユーザーがスロットリングの対象となりました。その結果、移行先の検索数が急増しました：openclaw ollama +507,000%、cluely pricing +92,600%、gemini cli +34,800%、z ai coding plan +8,500%（Google Trends、過去12か月）。
ローカルコーディングモデルがようやく実用レベルに到達。 Qwen 3.6 27B は17 GB Q4でSWE-bench Verified 77.2を記録しました。issue #6 で取り上げた推論エンジンの革新（MTP、DFlash、PAGED MoE）により、エージェントループにおける実用的なスループット差が縮小されました。

以下のラインナップは12か月前ではなく、現在の市場を反映しています。

一覧比較表

エージェント	価格（USD、2026-05）	基盤モデル	ローカル動作	オープンソース	UX
Claude Code	$20/mo Pro · $200/mo Max	Claude Sonnet 4.6 / Opus 4.7	不可	不可	CLI + IDEプラグイン
Cursor	$20/mo Pro · $40/mo Business	Claude / GPT / 独自ルーティング	不可	不可	VS Codeフォーク
OpenCode	無料（BYOK またはローカル）	任意（Ollama、Anthropic、OpenAI…）	可	可	ターミナル TUI
OpenClaw	無料（BYOK またはローカル）	任意（Ollama、vLLM、LM Studio、llama.cpp、Anthropic）	可	可（Node.js）	CLI、Telegram、Discord、Web
Gemini CLI	無料枠 · Vertex AI 有料	Gemini 2.5 Pro / Flash	不可	部分的（クライアントはOSS）	CLI
Cluely	約$20/mo Pro	独自マルチモデルルーティング	不可	不可	フローティングオーバーレイ
z.ai コーディングプラン	約$3/moから	GLM 4.6 / GLM 5 / GLM 5.1	不可（クラウド）；重みは部分公開	部分的	CLI + IDE

価格はベンダーページにて2026-05-20時点で確認済み。変動する場合があるため、購入時に必ずご確認ください。

ツールごとの詳細解説

1. Claude Code

最高水準の推論能力、実用的な最長コンテキスト（200k）、最も信頼性の高いツール使用ループ、ネイティブのSkillsとサブエージェント機能を備えています。

デメリットはスケール時のコストと4月に見られたようなポリシーリスクです。ローカルフォールバックはなく、オフラインモードもありません。

おすすめの場合： 複雑なリファクタリングを行うシニアエンジニアやテックリード、開発者の工数コストがトークンコストを上回るチーム。

2. Cursor

市場で最高のIDE統合体験を提供します。VS Codeのフォークそのものです。オートコンプリートのレイテンシはベストインクラスで、マルチファイルのコンテキスト理解も本当に優れています。

クラウド専用でCursorのエディタへのロックインがあります。ComposerエージェントループはマルチステップタスクでClaude Codeにまだ及びません。

おすすめの場合： IDEで作業することが多く、補完とチャットを1つのツールで使いたい方。

3. OpenCode

オープンソース、ターミナルネイティブ、BYOM対応。ソースコードが読みやすく、監査やフォークをしたい場合に拡張しやすい設計です。プライバシー優先の設計思想です。

SkillsエコシステムはOpenClawより小さく、ネイティブのチャットプラットフォームUIはなく、CLI非ネイティブには学習コストがあります。

おすすめの場合： ターミナルに慣れたバックエンドやインフラエンジニア、特にソースコードを読んだり拡張したい方。

4. OpenClaw

オープンエージェント分野最大規模のコミュニティのひとつで、GitHub数万スター、800以上のコミュニティSkillsを誇ります。TelegramとDiscordをUIとして使えるため、スマートフォンからコーディング作業を起動できるユニークな使い方が可能です。ここで紹介するエージェントの中で最も幅広いモデルバックエンドをサポートしています。

Node.jsの依存ツリーが重く、Skillsの品質にばらつきがあります。もともとのClaudeへの相乗りは現在制限されているため、費用対効果よく使うにはローカルモデルが必要です。

おすすめの場合： どこからでもコーディングタスクを起動したいインディーハッカーやサイドプロジェクト開発者。セットアップガイドもご参照ください。

5. Gemini CLI

Googleアカウントがあれば利用できる寛大な無料枠。Gemini 2.5 Proは推論能力で本当に競争力があります。1M以上のコンテキストウィンドウは実際に使える実用的なものです。

ツール使用の信頼性はClaudeにまだ及びません。エコシステムは成長中ですがまだ小さいです。無料クォータには上限があります。

おすすめの場合： コスト重視の方、学生、趣味の開発者、またはすでにGoogle Cloudエコシステムにいる方。

6. Cluely

軽量なフローティングオーバーレイで、IDEだけでなくあらゆるアプリで動作します。IDE以外のコーディングコンテキスト（面接、学習、ペアデバッグミーティング、ブラウザの開発ツール、Notion、Linearなど）に強力なアピールポイントがあります。十分な資金調達を受けており、2026年最も話題となった新参者です。cluely valuationは+119,400%、cluely pricingは+92,600%、cluely jobsは+99,700%（Google Trends、過去12か月）を記録しています。

モデルルーティングはブラックボックス（選択不可）。常時スクリーンキャプチャにはプライバシー上の明らかな懸念があります。$20/moはカバー範囲に対してやや高めです。

おすすめの場合： IDEだけでなく複数のアプリをまたいでコーディングし、どこでも一つのアシスタントを使いたい方。

7. z.ai（GLM）コーディングプラン

GLMファミリー（GLM 4.6、GLM 5、GLM 5.1）は本当に強力なモデルです。GLM 5.1はMMLU 87.2、HumanEval 91.5を記録しています。エントリープランはClaude Proより約80%安価です。

欧米の開発者への認知度はまだ低い状況です（z ai coding planは上昇中ですが出発点が小さい）。クラウドティアのデータ保存先は中国です。重みは部分的に公開されていますが、セルフホストには200 GB以上のVRAMクラスターが必要で、コンシューマーGPUのターゲットではありません。詳細はモデルページをご確認ください。

おすすめの場合： コスト重視で中国のクラウドプロバイダーに抵抗がなく、Anthropic料金の一部でフロンティアクラスの品質を求める方。

ローカル Ollama コーディング LLM — どれを使うべきか

OpenClawまたはOpenCodeをローカルバックエンドで使うと決めたなら、次はどのモデルをプルするかです。2026年の有力候補4選（ベンチマーク数値はすべてベンダー公表値、四捨五入済み）：

モデル	サイズ	VRAM（Q4）	HumanEval	SWE-bench Verified	速度（Apple M4 Max 48 GB）	備考
Qwen 3.6 27B	27Bデンス	17 GB	88.5	77.2	約45 tok/s	マルチモーダル。Claude Code / Qwen Codeツーリングに対応。デフォルトの選択。
Gemma 4 27B	27B MoE（4Bアクティブ）	17 GB	80.1	約55	約80 tok/s	トークン速度は速いが、マルチステップのエージェント処理は弱め
Qwen 3.5 9B	9B	6.5 GB	74.2	約40	約110 tok/s	エントリーティアのベスト、16 GB MacBookに対応
Qwen 3.5 27B	27B	17 GB	79.8	約62	約45 tok/s	旧世代だが依然として安定；量子化時のランニングコストが低め

ベンチマークはベンダーの公式リリース時の自己申告値です。独自の再実行（LiveCodeBench、BigCodeBench）では通常3〜8ポイント程度下回ります。絶対的な数値ではなく相対的なランキングとして参照してください。

実用的な推奨マトリクス

使用マシン	ユースケース	おすすめ
MacBook M1/M2、16 GB RAM	日常的な編集、オートコンプリート	Qwen 3.5 9B
MacBook M3/M4 Pro、24+ GB	リファクタリング、コードレビュー	Qwen 3.6 27B Q4
Apple M4 Max 48 GB	完全ローカルエージェントループ	Qwen 3.6 27B Q8
Linux + RTX 4090 24 GB	コンシューマーGPUのベストチョイス	Qwen 3.6 27B Q4 または Gemma 4 27B
Linux + RTX 5090 32 GB	コンテキストとKVキャッシュの余裕	Qwen 3.6 27B Q8
旧世代機器 / Intel Mac	ローカルは諦める	Gemini CLI 無料ティア

お使いのGPUが特定の量子化でどれだけ動作するかは runlocal calculator でご確認ください。

ローカル対クラウドの正直なリアルチェック

公表ベンチマークを比較すると、Qwen 3.6 27B はSWE-bench VerifiedでClaude Sonnet 4.6に約10〜15ポイント、LiveCodeBenchでも同程度の差があります。実際には、マルチファイルのリファクタリングや複雑な並行性バグで差が出ますが、日常的な作業（テストのスキャフォールディング、単一ファイルのリファクタリング、グルーコード、ドックストリングなど）は初回生成で十分使えることが多いです。独自のタスクセットによる本格的な比較は将来の号で公開する予定です。それまでは、ベンダーブログの「我々はXを実行した」という主張には同様の懐疑心を持って接してください。

issue #6 で取り上げた2026年5月の推論エンジンの革新（MTP、DFlash、llama.cpp MTPがmainにマージ）は、このギャップのスループット面を静かに縮めています。品質面のギャップを埋めるにはもう一世代かかるでしょう。

決定フローチャート

Q1. Do you need offline / no-cloud / no telemetry?
    YES → OpenClaw or OpenCode + Ollama + Qwen 3.6 27B
    NO  → continue

Q2. Is your hourly rate > $50?
    YES → Claude Code (Max) or Cursor — your time dominates
    NO  → continue

Q3. Do you live inside the IDE?
    YES → Cursor
    NO  → continue

Q4. Cost-sensitive but want strong cloud models?
    YES → Gemini CLI (free) or z.ai coding plan ($3–15/mo)
    NO  → continue

Q5. Do you code across many apps, not just an IDE?
    YES → Cluely
    NO  → Claude Code Pro is the default safe pick

次に注目していること

Cluely vs Claude Code のマルチアプリワークフロー比較。 オーバーレイモデルは genuinely 新しいアプローチです。将来の号で詳細な比較レビューを予定しています。
z.ai の価格攻勢。 GLM 5.1が品質を維持し、z.aiが値下げを続ければ、Anthropicは2026年Q3にProの価格で対応してくる可能性があります。
コンシューマーGPUでの32B+ローカルモデル。 次世代のQwenコーダーが幅広いOllamaサポートとともにリリースされると、ローカルとクラウドの品質差がさらに縮まります。
Hermes Agent。 Ollamaネイティブのエージェントフレームワークとして台頭中で、Google Trendsで+30,200%を記録。安定次第、インストール手順を紹介する予定です。

FAQ

Claude Code は月$200の価値があるか？ 時給$80以上で請求していて、エージェントが月2.5時間以上を節約できるなら、はい。趣味の開発者には不要で、Gemini CLI無料ティアまたはOpenClaw + Ollamaから始めることを推奨します。

Anthropic に課金せずに OpenClaw を使えるか？ はい。OllamaにポイントするだけでOKです。これが2026年4月の制限後に多くのユーザーが取った移行経路です。セットアップガイドをご参照ください。

Cluely は Cursor と同じか？ いいえ。CursorはIDEです。Cluely はあらゆるアプリの上に重なるフローティングオーバーレイです。カテゴリーが異なります。

実際に使える最安の有料コーディングエージェントは？ z.aiのGLMコーディングエントリープラン（約$3/mo）が2026-05時点で最安の本格的な選択肢です。Gemini CLI無料ティアもクォータに達するまでは実用的です。

なぜ openclaw ollama がこれほど検索されているのか？ Anthropicの2026年4月のサードパーティ制限により、数千人のOpenClawユーザーがレートリミットのないモデルバックエンドを探すことになりました。Ollamaが明白な答えでした。完全な移行ガイドを issue #7 として書きました。

← 全ての記事