日本語
Multi-Model2026年4月9日 · 13 min

マルチモデルか、死か:あなたのコーディングエージェントは一つのベンダーに賭けるべきではない

Claude Code はあるユーザーの週次上限の 27% をリトライループで燃やし、出力ゼロだった。Cursor は数時間ダウンする。Copilot は Grok にアクセスできない。Franklin は 55 モデルにルーティングし、サインアップなしの無料枠で始まり、出力がない瞬間に課金を止めるオープンソースのエージェントだ。

マルチモデルか、死か:あなたのコーディングエージェントは一つのベンダーに賭けるべきではない

今週 Claude Code の issue tracker で最も「いいね」を集めている文句は、本質的に同じ一文の変奏だ。「リトライ分の課金は受けたが、何も得られていない」

Issue #54143:あるユーザーの codex:resume セッションが 12 時間で週次上限の 27% を焼き、ゼロ進捗。Issue #54177:5 時間ウィンドウ 0%、週 5% で「使用上限到達」。Issue #54190:API タイムアウトでトークンが控除されたが完了していない。Issue #54146:CLI が極めて明確な指示に従わない — 同じセッション、3 リトライ、3 種類の失敗、すべて課金された。

これらはランダムなバグではない。単一ベンダーのコーディングエージェントの構造的な失敗モード だ — ツールの背後にモデルが一つ、課金関係が一つしかなければ、いずれかのシステムが劣化するたびに、その損失はそのまま開発者に降りかかる。

Franklin は反対の前提で作られている。マルチモデルは Franklin のロードマップ上の機能ではない。アーキテクチャだ。 その前提で構築すれば、他の四つ — 無料枠、結果ベースの課金、ベンダーダウン耐性、サインアップなしの地理的到達 — は単に可能なだけでなく必然になる。

「単一ベンダー」が実際にいくら課金しているか

エージェントが一つのプロバイダで動くと、あなたは三つの税を払っている:

ベンダーダウン税。 Anthropic がしゃっくりすると、Claude Code は止まる。「次のモデル」ボタンはない。あなたは次の 45 分間ステータスページを更新するだけ。Cursor は 3 月のある金曜に 6 時間ダウンした; 何千もの開発者が待つだけだった。これは構造的だ — 単一ベンダーのエージェントには切り替え先がない。

モデル漂移税。 1 月に使った Sonnet と 4 月に使う Sonnet は同じ Sonnet ではない。Anthropic は変更を出荷する。新しいモデルが鋭くなることもあれば、3 行前に書いた指示を無視することもある — 上の #54146 のように。あなたに為す術はない。「12 月版を使え」とは言えない。「これは Grok でやれ」とも言えない。漂移を受け入れるか、出荷しないかだ。

価格決定権税。 エージェントとモデルが同じベンダーなら、ベンダーが価格上限を決める。リトライ課金もできる、タイムアウトもできる、低使用率でスロットルもできる。唯一の修復は「週次上限がリセットされるまで待つ」。サブスクリプションはサービスではない。配達する前に支払いを得る方法だ。

マルチモデルのエージェントはこの三税をすべて取り除く。Anthropic が劣化したら、Franklin は Grok か Gemini にルーティングして呼び出しを完了する。モデルが指示で漂移したら、タスクごとに入れ替える。一つのプロバイダの価格上限が上がったら、ルーターは閾値を満たす次に安いモデルを選び始める。エージェントはもはや任意の単一ベンダーの当たり日に賭けていない。

Smart Router、具体的な数値で

Franklin の Smart Router は 200 万件の実リクエスト で訓練された。すべてのプロンプトを分類し — コーディング、トレーディング、推論、リサーチ — そのクラスで最も品質コスト比が良いモデルを選ぶ。すべての応答で、選ばれたモデルと、常に Opus の場合との節約率が表示される:

> refactor this auth module to use JWT
  CODING kimi-k2.6  ·  12.4K in / 2.1K out  ·  $0.0023  saved 84%

> what's BTC outlook for the week?
  TRADING grok-4-1-fast-reasoning  ·  8.2K in / 1.8K out  ·  $0.0008  saved 95%

> prove this algorithm is O(n log n)
  REASONING claude-sonnet-4.6  ·  15.1K in / 3.4K out  ·  $0.0312  premium tier

最後の列が重要。この呼び出しのコスト、選択の理由、選ばなかった代替の価格 — 三つすべて、決定の瞬間にターミナルに見える。請求サイクルのサマリーではない。トークンメーターでもない。

ルーターはセッションごとにピン留めできる四つのプロファイルを持つ:

プロファイル戦略用途
auto最良の品質コスト比デフォルト — 賢い消費
eco質が許容できる最安モデルバルク、探索的、ETL
premiumコスト無視で最高品質ミッションクリティカル
freeNVIDIA + Qwen3 のみウォレット残高ゼロ

最後の行に注目してほしい。

「無料」は階層ではない。デフォルトだ。

ほとんどの AI ツールの「無料枠」はカード登録が必要な 5 日試用だ。Franklin の無料枠は違う。NVIDIA Nemotron と DeepSeek V4 Flash を使う — どちらも源泉で本当に無料。補助金なし、試用なし、タイマーなし。Franklin をインストールして CLI を実行するだけで動く:

npm install -g @blockrun/franklin
franklin
# 無料モデルがすぐに動く。ウォレットなし、メールなし、カードなし。

フロンティアモデルが欲しいときだけウォレットをファンドする。$5 の USDC でゲートウェイのすべての有料モデルとツールが解錠される。 サブスクなし。最低額なし。コミットメントなし。ウォレットが上限。空になればエージェントは止まり、好きなときにリロードする。

Cursor にこの種の無料枠を提供できないのに、私たちにはできる理由はこれだ。Cursor はバンドルでユニットエコノミクスが回っている。私たちのは 無料モデルの料金を払っていない から回る — それらは源泉で既に無料だ。有料モデルだけ、あなたが頼んだときに、プロバイダコスト + 5% を呼び出しごとに課金する。無料は本当に無料、有料は正直に有料。

戦略上の帰結:Franklin を試すコストはゼロ、安いタスクで使い続けるコストもゼロ。 バンガロールの開発者は今夜 Franklin をインストールし、Qwen3 を 1000 回呼び出し、支払い画面を見ることなく、難しい一題で Sonnet が欲しくなったときに初めてウォレットに会う。

YOPO:「リトライに払って何も得られなかった」への明細レベルの答え

Claude Code の issue を振り返ろう。パターンは同じ形をしている: ユーザーの割り当ては作業が検証される に控除された。リトライは課金。タイムアウトは課金。有用な出力を返さなかった失敗実行も課金。プラットフォームは「試すこと」に課金した。

Franklin の課金モデルにはそれの名前がある — YOPO、You Only Pay Outcome(結果にしか払わない)。決済層(USDC 上の x402 マイクロペイメント)が呼び出しごとに、オンチェーンで、ゼロチャージバックリスクで決済するから機能する。呼び出しが失敗したら、マーチャントは支払いに署名しない。ウォレットは引き落とされない。四半期の照合もサポートチケットも「来月クレジットを付与します」もない。あるのはただ「呼び出しが何かを生んだ、ウォレットが払った; 何も生まなかった、ウォレットは動かなかった」だけ。

そこから三つが落ちる:

  1. サブスクなし。 一週 $0.50、次の週 $50。実際に消費した計算量に払う。
  2. レート制限なし。 サブスクは最悪の瞬間にスロットルする。YOPO に人為的上限はない。ウォレットに USDC があれば、モデルがある。
  3. オーバードラフトなし。 ウォレット残高が真のハード上限。空のウォレット、エージェント停止。月末のサプライズなし。

実際の容量での $1 の見え方:

リソース$1 でだいたい
GPT-4o 入力トークン~40 万
DeepSeek トークン~700 万
Gemini 2.5 Flash トークン~1300 万
DALL-E 3 画像~20
Exa ニューラル検索~40
NVIDIA GPT-OSS / Qwen3無制限(無料枠)

競合をこの隣に並べると

コーディングエージェントエディタ IDEチャットボットFranklin
コードを書く
あなたに代わってお金を使う×××○ — USDC ウォレット、x402
データ・API・画像・検索を購入×××○ — 55+ API、一つのウォレット
タスクごとに最適モデルを選ぶ× 単一ベンダー× プラン依存×○ — Smart Router、55+ モデル
課金モデルサブスクサブスクサブスクYOPO — 結果ごと、USDC
月額$20–$200$20–$40$20+$0
レート制限ありありありなし — ウォレットのみ
プロバイダダウン時に動く×××○ — 別にルーティング
アイデンティティベンダーアカウントベンダーアカウントアカウント / メールウォレット、サインアップなし
無料スタート、KYC なし×××
ソースクローズドクローズドクローズドApache 2.0、ローカルファースト

Franklin は経済エージェントカテゴリを一文にまとめた: 結果に向かって支出できる、ウォレットを持つソフトウェア。 どの一行も単独なら競合は対抗できる。スタック全体 — マルチモデル + 無料枠 + YOPO + ウォレットアイデンティティ + オープンソース — を取れば、価格エンジン、課金スタック、モデル戦略、ライセンス姿勢を同時に再構築せずにこれを出荷できるクローズド競合は存在しない。

明日具体的に何をするか

現在 Claude Code を使っていて、リトライで予算を焼かれたことがあるなら — マルチモデルの代替はコマンド二つだ。

npm install -g @blockrun/franklin
franklin

無料枠で起動し、NVIDIA Nemotron と DeepSeek V4 Flash を実行する、カードなし、サインアップなし。一つのタスクで Sonnet をピン留めしたければ、$5 をウォレットにファンドして --profile premium を使う。モデルが指示で漂移したら、プロファイルを切り替える。プロバイダがセッション中にダウンしたら、ルーターが次のプロバイダにフェイルオーバーし、呼び出しは完了し、作業は続く。

完全なソース を GitHub で読むこともできるし、Smart Router のドキュメント でルーティング決定の作り方を読むこともできる。

Franklin の背後にある賭けは単純だ:単一ベンダーのコーディングエージェントは過渡的製品だ。 二年前は、多くのプロバイダにリアルタイムでマイクロアマウントを支払うレールが存在せず、オープンモデルもルーティングするほど良くなかった。両方の事実はもう成立しない。ルーティングするエージェントが勝つ。あなたをロックインするエージェントが負ける。 唯一の問題はいつかだ。

今週も週次上限を焼き切ったなら — その「いつか」は、今だ。


Franklin はオープンソース(Apache 2.0)。386 stars、5M+ リクエスト、50+ 国、OpenClaw 統合と口コミで自然成長中。私たちはルーティング先のモデルプロバイダから投資を受けない。

今すぐ試す

Franklin をインストール

コマンド二つ。無料枠が即時動く。ウォレットは自動生成。

$ npm install -g @blockrun/franklin
$ franklin

#franklin#multi-model#claude-code#smart-router#yopo#open-source