Мульти-модель или смерть: почему ваш кодинг-агент не должен ставить на одного вендора
Claude Code сжёг 27% недельного лимита одного пользователя на ретраях с нулём вывода. Cursor падает на часы. Copilot не может дотянуться до Grok. Franklin — open-source агент, который маршрутизирует между 55 моделями, стартует бесплатно без регистрации и перестаёт списывать деньги в момент, когда нечего возвращать.
Самая залайканная жалоба в issue tracker Claude Code на этой неделе — вариации одной фразы: «Я заплатил за ретраи, которые ничего не вернули».
Issue #54143: сессия codex:resume пользователя сожгла 27% недельного лимита за 12 часов с нулевым прогрессом. Issue #54177: «лимит исчерпан» при 0% / 5%. Issue #54190: тайм-аут API списал токены без выполнения. Issue #54146: CLI не следует чётким инструкциям — одна сессия, три ретрая, три разных провала, всё списано.
Это не случайные баги. Это структурный режим отказа агентов от одного вендора: когда у инструмента одна модель сзади и одна биллинговая связь, любая деградация в любой из систем падает прямо на разработчика, который пытается выпустить.
Franklin построен на обратной предпосылке. Мульти-модель — не фича в роадмапе Franklin. Это архитектура. На этой предпосылке остальные четыре — бесплатный тир, оплата за результат, иммунитет к сбоям вендора, географическая досягаемость без регистрации — становятся не просто возможными, а неизбежными.
Какие три налога вы платите за «одного вендора»
Налог на сбой вендора. Когда у Anthropic икота, Claude Code останавливается. Кнопки «следующая модель» нет. Cursor лежал шесть часов в марте; тысячи разработчиков просто ждали.
Налог на дрейф модели. Sonnet, который был резким в январе, в апреле — не тот же Sonnet. Anthropic катит изменения. Иногда новая модель острее, иногда игнорирует инструкцию из трёх строк выше — как в #54146. Откатиться нельзя.
Налог на ценовую власть. Когда агент и модель — один вендор, потолок цены — у вендора. Можно брать за ретраи, троттлить на низком использовании, единственный фикс — «жди, пока недельный лимит обновится».
Мульти-модельный агент убирает все три. Anthropic деградировал — Franklin маршрутизирует на Grok или Gemini и заканчивает вызов. Агент больше не делает ставку на хороший день одного вендора.
Smart Router в конкретных цифрах
Smart Router Franklin обучен на 2 миллионах реальных запросов. Классифицирует каждый промпт — кодинг, трейдинг, рассуждение, ресерч — и выбирает модель с лучшим соотношением качество-цена для класса:
> refactor this auth module to use JWT
CODING kimi-k2.6 · 12.4K in / 2.1K out · $0.0023 saved 84%
> what's BTC outlook for the week?
TRADING grok-4-1-fast-reasoning · 8.2K in / 1.8K out · $0.0008 saved 95%
> prove this algorithm is O(n log n)
REASONING claude-sonnet-4.6 · 15.1K in / 3.4K out · $0.0312 premium tier
Четыре профиля, фиксируемые на сессию:
| Профиль | Стратегия | Когда |
|---|---|---|
auto | Лучшее качество/цена | По умолчанию |
eco | Самая дешёвая с приличным качеством | Объём, ETL |
premium | Максимум качества | Критичное |
free | Только NVIDIA + Qwen3 | Нулевой баланс |
«Бесплатно» — не тир, а дефолт
В большинстве AI-инструментов «бесплатный тир» — это пятидневный триал с картой. У Franklin иначе. Используются NVIDIA Nemotron и DeepSeek V4 Flash — реально бесплатные у источника. Никаких субсидий, без таймера:
npm install -g @blockrun/franklin
franklin
# бесплатные модели работают сразу. ни кошелька, ни почты, ни карты.
Кошелёк нужен только когда захочешь фронтир. $5 USDC — все платные модели и инструменты гейтвея разблокированы. Без подписки, без минималки.
Почему мы можем дать такой бесплатный тир, а Cursor — нет? Cursor строит экономику на бандле. Наша экономика работает потому, что мы не платим за бесплатные модели — они уже бесплатны у источника.
Стратегическое последствие: попробовать Franklin стоит ноль, и продолжать пользоваться им на дешёвых задачах — тоже ноль.
YOPO: построчный ответ на «я заплатил, но ничего не получил»
Franklin называет это YOPO — You Only Pay Outcome. Работает потому, что слой расчётов (x402 на USDC) рассчитывается ончейн, по вызову, без чарджбек-риска. Если вызов провалился — мерчант не подписывает платёж. Кошелёк не списан.
Из этого выпадают три вещи:
- Без подписок. Неделя $0.50, следующая $50.
- Без рейт-лимитов. Без искусственных потолков.
- Без овердрафта. Баланс кошелька — это лимит.
$1 в реальной мощности:
| Ресурс | За $1 |
|---|---|
| GPT-4o входные токены | ~400 тыс |
| DeepSeek токены | ~7 млн |
| Gemini 2.5 Flash токены | ~13 млн |
| DALL-E 3 изображения | ~20 |
| Exa-поиски | ~40 |
| NVIDIA GPT-OSS / Qwen3 | без лимита (бесплатно) |
Конкуренты рядом
| Кодинг-агенты | Editor IDE | Чатботы | Franklin | |
|---|---|---|---|---|
| Пишет код | да | да | частично | да |
| Тратит деньги за тебя | нет | нет | нет | да — USDC, x402 |
| Покупает данные/API/картинки | нет | нет | нет | да — 55+ API |
| Выбирает лучшую модель | нет | нет | нет | да — 55+ моделей |
| Цена | подписка | подписка | подписка | YOPO |
| Месячная плата | $20–200 | $20–40 | $20+ | $0 |
| Рейт-лимит | да | да | да | нет |
| Работает при сбое провайдера | нет | нет | нет | да — маршрутизирует |
| Личность | аккаунт | аккаунт | кошелёк, без регистрации | |
| Старт бесплатно, без KYC | нет | нет | нет | да |
| Источник | закрыт | закрыт | закрыт | Apache 2.0 |
Что сделать завтра
Если ты сейчас на Claude Code и сессия сжигала бюджет на ретраях — мульти-модельная альтернатива в две команды:
npm install -g @blockrun/franklin
franklin
На бесплатном тире работают NVIDIA Nemotron и DeepSeek V4 Flash, ни карты, ни регистрации. Захотел Sonnet на одну задачу — закидывай $5 и --profile premium. Модель задрейфовала — сменил профиль. Провайдер упал — роутер фейловерит на следующего, вызов завершается, ты работаешь.
Полный исходник на GitHub. Документация роутера — как принимаются решения.
Ставка Franklin прямая: агенты от одного вендора — переходный продукт. Маршрутизирующие агенты выиграют. Локинящие — проиграют. Вопрос только — когда.
Если на этой неделе тебе снова сожгли недельный лимит — это «когда», и оно сейчас.
Franklin — open source (Apache 2.0). 386 звёзд, 5М+ запросов, 50+ стран, органический рост через интеграции OpenClaw и сарафан. Мы не берём инвестиции у тех вендоров моделей, на которых маршрутизируем.
