멀티모델이 아니면 죽는다: 코딩 에이전트가 한 벤더에 베팅하면 안 되는 이유
Claude Code는 한 사용자의 주간 한도 27%를 재시도 루프로 태웠고, 결과는 0이었다. Cursor는 몇 시간씩 다운된다. Copilot은 Grok에 닿지 못한다. Franklin은 55개 모델 사이를 라우팅하고, 가입 없이 무료로 시작하며, 결과가 없으면 비용 청구를 멈추는 오픈소스 에이전트다.
이번 주 Claude Code issue tracker에서 가장 많은 추천을 받은 불만은 본질적으로 같은 문장의 변주다: "재시도에 돈을 냈는데 아무것도 나오지 않았다."
Issue #54143: codex:resume 세션이 12시간 동안 주간 한도의 27%를 태우고 진전 0. Issue #54177: 5시간 윈도우 0%, 주간 5%에서 "사용 한도 초과." Issue #54190: API 타임아웃이지만 토큰은 차감됨. Issue #54146: CLI가 매우 명확한 지시를 따르지 않음 — 같은 세션, 3번의 재시도, 3가지 다른 실패, 모두 청구됨.
이건 무작위 버그가 아니다. 단일 벤더 코딩 에이전트의 구조적 실패 모드다 — 도구 뒤에 모델이 하나, 청구 관계가 하나뿐이라면, 어느 시스템이 저하되든 그 손실은 그대로 출시하려는 개발자에게 떨어진다.
Franklin은 반대 전제 위에 지어졌다. 멀티모델은 Franklin 로드맵의 기능이 아니다. 아키텍처다. 이 전제 위에 쌓으면, 다른 네 가지 — 무료 티어, 결과 기반 가격, 벤더 다운 면역, 가입 없는 지리적 도달 — 가 단지 가능한 게 아니라 불가피해진다.
"단일 벤더"가 실제로 받아내는 세 가지 세금
벤더 다운 세금. Anthropic이 딸꾹질하면 Claude Code는 멈춘다. "다음 모델" 버튼이 없다. 다음 45분을 status 페이지를 새로고침하며 잃는다. Cursor는 3월 어느 금요일 6시간 다운됐다; 수천 명의 개발자가 기다릴 수밖에 없었다. 이건 구조적이다.
모델 드리프트 세금. 1월에 쓰던 Sonnet과 4월에 쓰는 Sonnet은 같은 Sonnet이 아니다. Anthropic이 변경을 출시한다. 새 모델이 더 날카로울 때도 있고, 3줄 전에 쓴 지시를 무시할 때도 있다 — 위 #54146처럼. 당신은 어쩔 도리가 없다. "12월 버전을 써"라고 할 수 없다.
가격 결정권 세금. 에이전트와 모델이 같은 벤더면 벤더가 가격 천장을 정한다. 재시도에 청구할 수 있고, 타임아웃 시킬 수 있고, 낮은 사용률에서 스로틀링할 수 있고, 유일한 해결은 "주간 한도 갱신을 기다려라"다.
멀티모델 에이전트는 이 세 세금을 모두 제거한다. Anthropic 저하 시 Franklin은 Grok이나 Gemini로 라우팅해 호출을 끝낸다. 에이전트는 더 이상 어떤 단일 벤더의 좋은 날에 베팅하지 않는다.
Smart Router, 구체적 숫자로
Franklin의 Smart Router는 200만 건의 실제 요청으로 훈련됐다. 모든 프롬프트를 분류하고 — 코딩, 트레이딩, 추론, 리서치 — 그 클래스에 가장 좋은 품질-비용 비율의 모델을 선택한다. 모든 응답이 어떤 모델을 골랐고, 항상-Opus 대비 얼마나 절약했는지 보여준다:
> refactor this auth module to use JWT
CODING kimi-k2.6 · 12.4K in / 2.1K out · $0.0023 saved 84%
> what's BTC outlook for the week?
TRADING grok-4-1-fast-reasoning · 8.2K in / 1.8K out · $0.0008 saved 95%
> prove this algorithm is O(n log n)
REASONING claude-sonnet-4.6 · 15.1K in / 3.4K out · $0.0312 premium tier
세션별로 고정할 수 있는 네 가지 프로파일:
| 프로파일 | 전략 | 사용처 |
|---|---|---|
auto | 최상의 품질-비용 비율 | 기본값 |
eco | 품질이 괜찮은 가장 싼 모델 | 대량, 탐색적 |
premium | 비용 무시, 최고 품질 | 미션 크리티컬 |
free | NVIDIA + Qwen3만 | 지갑 잔고 0 |
마지막 줄을 주목하라.
"무료"는 티어가 아니라 기본값
대부분 AI 도구의 "무료 티어"는 카드 등록이 필요한 5일 체험판이다. Franklin의 무료 티어는 다르다. NVIDIA Nemotron과 DeepSeek V4 Flash를 쓰는데, 이들은 원천에서 진짜 무료다.
npm install -g @blockrun/franklin
franklin
# 무료 모델이 즉시 작동. 지갑, 이메일, 카드 없이.
프론티어 모델을 원할 때만 지갑을 채운다. $5 USDC면 게이트웨이의 모든 유료 모델과 도구가 잠금 해제된다. 구독 없음, 최저액 없음.
이걸 우리가 할 수 있고 Cursor는 못 하는 이유: Cursor는 단가 경제학이 번들에 의존한다. 우리는 무료 모델 비용을 우리가 내지 않는다 — 원천에서 이미 무료다.
전략적 결과: Franklin을 시도하는 비용은 0, 싼 작업으로 계속 쓰는 비용도 0.
YOPO: "재시도에 돈을 냈는데 아무것도 나오지 않았다"에 대한 항목별 답
다시 Claude Code issue들로. 패턴은 같다: 사용자의 할당량은 작업이 검증되기 전에 차감됐다.
Franklin 가격 모델에는 이름이 있다 — YOPO, You Only Pay Outcome. 결제 레이어(USDC 위 x402 마이크로페이먼트)가 호출당, 온체인, 차지백 제로 리스크로 정산하기 때문에 작동한다. 호출이 실패하면 머천트는 결제에 서명하지 않는다. 지갑은 차감되지 않는다.
여기서 세 가지가 따라온다:
- 구독 없음. 한 주 $0.50, 다음 주 $50.
- 레이트 리밋 없음. 인공 상한 없음.
- 오버드래프트 없음. 지갑 잔고가 진짜 한도.
$1로 실제 가능한 것:
| 자원 | $1로 약 |
|---|---|
| GPT-4o 입력 토큰 | ~40만 |
| DeepSeek 토큰 | ~700만 |
| Gemini 2.5 Flash 토큰 | ~1300만 |
| DALL-E 3 이미지 | ~20장 |
| Exa 신경 웹 검색 | ~40회 |
| NVIDIA GPT-OSS / Qwen3 | 무제한 (무료) |
경쟁사 비교
| 코딩 에이전트 | 에디터 IDE | 챗봇 | Franklin | |
|---|---|---|---|---|
| 코드 작성 | 예 | 예 | 부분적 | 예 |
| 대신 돈 지불 | 아니오 | 아니오 | 아니오 | 예 — USDC, x402 |
| 데이터/API/이미지/검색 구매 | 아니오 | 아니오 | 아니오 | 예 — 55+ API |
| 작업당 최적 모델 선택 | 아니오, 단일 | 아니오 | 아니오 | 예 — 55+ 모델 |
| 가격 모델 | 구독 | 구독 | 구독 | YOPO |
| 월 요금 | $20–$200 | $20–$40 | $20+ | $0 |
| 레이트 리미트 | 예 | 예 | 예 | 아니오 |
| 제공자 다운 시 작동 | 아니오 | 아니오 | 아니오 | 예 — 다른 곳으로 |
| 신원 | 벤더 계정 | 벤더 계정 | 계정/이메일 | 지갑, 가입 없음 |
| 무료 시작, KYC 없음 | 아니오 | 아니오 | 아니오 | 예 |
| 소스 | 클로즈드 | 클로즈드 | 클로즈드 | Apache 2.0 |
각 행은 단독으로 매칭 가능하지만, 전체 스택 — 멀티모델 + 무료 티어 + YOPO + 지갑 신원 + 오픈소스 — 를 합치면 가격 엔진, 청구 스택, 모델 전략, 라이선스 자세를 동시에 재구축하지 않고서는 클로즈드 경쟁사가 출시할 수 없다.
내일 무엇을 하느냐
지금 Claude Code 사용자고 세션이 재시도로 예산을 태운 적 있다면, 멀티모델 대안은 명령어 두 개:
npm install -g @blockrun/franklin
franklin
무료 티어에서 NVIDIA Nemotron과 DeepSeek V4 Flash를 실행, 카드 없음, 가입 없음. 한 작업에 Sonnet을 고정하고 싶으면 $5을 충전하고 --profile premium 사용. 모델이 드리프트하면 프로파일 변경. 제공자가 세션 중 다운되면 라우터가 페일오버.
전체 소스는 GitHub에. 스마트 라우터 문서도 참조.
Franklin의 베팅: 단일 벤더 코딩 에이전트는 과도기 제품. 라우팅하는 에이전트가 이긴다. 락인하는 에이전트가 진다. 유일한 질문은 언제냐.
이번 주에 또 주간 한도가 태워졌다면 — "언제냐"가 바로 지금이다.
Franklin은 오픈소스(Apache 2.0). 386 stars, 5M+ 요청, 50+ 국가에서 OpenClaw 통합과 입소문으로 유기적 성장. 우리는 라우팅하는 모델 제공자로부터 투자를 받지 않는다.
