Я дал Franklin $20 и сценарий. Через три часа у меня было видео.
Большинство агентов останавливаются на коде. Franklin не останавливается — он покупает сценарий, делает раскадровку с gpt-image-2, рендерит клипы на Seedance, озвучивает закадровый текст, лицензирует музыку, всё из одного кошелька. Точная роспись расходов и почему ни один другой агент это не сделал бы.
Это не должно было быть видео про Franklin. Начали как внутренний эксперимент: взять самую тяжёлую творческую задачу, которую можем придумать — 60-секундный объяснительный ролик с озвучкой, музыкой и оригинальной графикой — и проверить, может ли один агент действительно сделать всё от начала до конца. Ограничения жёсткие. Один терминал. Один кошелёк. Баланс USDC с потолком в $20. Никаких аккаунтов на image-API, никакой подписки ElevenLabs, никакого логина в Seedance, никакой лицензии Soundstripe, никакого Adobe. Агент должен был сам найти каждый инструмент, сам заплатить и сдать.
Через три часа видео лежало на диске. Кошелёк показывал, что на это ушло $11.97. Чек — каждый промпт, каждая модель, каждый платёж — был одним текстовым файлом, который Franklin выводил по ходу. Это и есть тот файл, с историей за каждой строкой.
Это, на мой взгляд, самая чистая демонстрация того, почему «агент с кошельком» не слоган. Это структурная разница между AI-инструментом, который тебе помогает, и AI-инструментом, который доводит работу до конца.
Бриф
> 60-секундное объясняющее видео для разработчиков без крипто-фона.
Тема: почему pay-per-call AI — будущее, USDC — рельса.
Стиль: минималистичная банкнотная эстетика, золото на чернилах.
Сдача: финальный mp4, музыка, озвучка, 3 ключевых кадра.
Бюджет: $20 USDC. Жёсткий потолок.
В Franklin я набрал ровно это. Больше ничего.
Чек, по порядку
Шаг 1 — Ресерч и аутлайн
✓ WebSearch "USDC AI micropayments 2026" $0.0008
✓ WebFetch 3 articles + Franklin docs $0.0003
✓ Reason outline 4 beats (nemotron, free) $0.0000
$0.0011. Планирование на бесплатном Nemotron, USDC ушёл только на факт-чек.
Шаг 2 — Полировка сценария
✓ Compose 60s narration (claude-sonnet-4.6) $0.0089
На текст озвучки Franklin эскалировался к Sonnet. Один цент. 152 слова, ровно под спокойный 60-секундный голос.
Шаг 3 — Ключевые кадры (gpt-image-2)
✓ ImageGen 3 banknote stills (gpt-image-2, hd) $0.3600
Franklin выбрал openai/gpt-image-2, а не DALL-E 3 — потому что в промпте требовалось вживить текст «franklin · dispatch» в банкнотную графику, а из доступных моделей текст в картинке без ошибок умеет рисовать только gpt-image-2. Многоязычность и стабильность персонажа между кадрами — туда же. Три HD-кадра $0.36. Один отбраковал, регенерация +$0.12, всё всплыло до списания.
Шаг 4 — Озвучка
✓ Voice ElevenLabs, voice "Adam" v2 (60s) $0.4200
Никакого аккаунта ElevenLabs, отдельного API-ключа и карты. Franklin зовёт ElevenLabs тем же x402-микроплатежом. 60 секунд — $0.42. В .env ключа нет.
Шаг 5 — Видео-клипы (Seedance)
✓ Video bytedance/seedance-2.0-fast 3×10s $4.5000
✓ Video bytedance/seedance-2.0 2×10s $6.0000
Пять 10-секундных 720p видео, смешанных по двум тирам Seedance — три на bytedance/seedance-2.0-fast ($0.15/сек) для абстрактных движений, два на полный bytedance/seedance-2.0 Pro ($0.30/сек) для кадров с персонажем. Видео всего: $10.50.
Роутер апгрейднулся на 2.0 Pro только в двух кадрах, где важна персонажная верность, а в трёх «движение само вытаскивает» использовал -fast в два раза дешевле. Перед расчётом распечатался выбор по каждому кадру и экономия против «всегда Pro».
Шаг 6 — Музыка
✓ Audio Stable Audio, 60s instrumental $0.1800
18 центов оригинальной струнной. Franklin сначала вычислил BPM из аудио озвучки, потом заказал.
Шаг 7 — Сборка
✓ Bash ffmpeg compose final mp4 $0.0000
✓ Bash verify duration 60s $0.0000
Локальный FFmpeg, бесплатно. 59.4 секунды, 18.2 MB MP4, 720p, встроенные сабы.
Итог
─────────────────────────────────────────────
Сессия итого $11.97
ресерч + сценарий $0.01
кадры (gpt-image-2) $0.36
озвучка (ElevenLabs) $0.42
видео (Seedance микс) $10.50
музыка (Stable Audio) $0.18
сборка $0.00
Остаток в кошельке $8.03
Жёсткий потолок соблюдён ✓
Время 3ч 11мин
─────────────────────────────────────────────
Где останавливаются все остальные кодинг-агенты
На коде. Все они останавливаются на коде. Cursor напишет тебе сценарий — но не оплатит озвучку. Claude Code разложит четыре биты — но не сделает раскадровку. Copilot подскажет команду FFmpeg — но не лицензирует музыку. Под ними нет слоя расчётов.
По старому пять шагов:
- ElevenLabs: регистрация, карта, минимум $10, ключ в
.env. - Реселлер Seedance (прямых розничных почти нет): карта, ключ.
- OpenAI: запрос на доступ к gpt-image-2, карта, организация, ожидание модерации, ключ.
- Stable Audio: регистрация, карта, $9 пакет.
- Пять строк в
.env, не вставить в Slack.
До старта работы: 45–90 минут. Фиксированно в месяц: $54+. Это всё налог на доступ.
Franklin: $11.97 итого. Никаких подписок. Никаких credentials в .env. Кошелёк — это ключ.
Почему именно gpt-image-2 + Seedance
gpt-image-2 — первая массово доступная модель, которая рендерит читаемый текст внутри картинки на любом языке без опечаток. Банкнота, упаковка, постер, соцкарта, двуязычная вывеска — это не +10%, это разница между «годится» и «нет». В рамках одной сессии стабильно держит идентичность персонажа между кадрами. HD: $0.06–$0.12.
Seedance 2.0 — сейчас лучшая в открытом рынке цена/качество для видео. Полный 2.0 Pro выдаёт 720p, конкурируя с моделями в 5× дороже. Вариант -fast за $0.15/сек — новая золотая середина для B-roll и абстрактного движения. До 10 секунд клипа, image-to-video через seed-картинку, асинхронные джобы с зеркалированием MP4 в постоянное хранилище.
Работа Franklin — выбирать между ними покадрово. В этом видео все пять кадров выбраны верно. Это и есть мульти-модель — не «много моделей существуют», а «агент выбирает правильно сам».
Что ещё с этим делается
- Промо-ролик продукта (60с, 720p) — $12–$25
- Онбординг-видео на трёх языках — $25–$45
- Еженедельный объяснитель для Substack — $8–$15
- 10-минутное эссе на YouTube — $50–$100
- Глава аудиокниги — $0.60–$1.20
Каждое из этого раньше требовало папки чеков и подписочного пола в $200/мес. Сейчас — отдельные franklin-сессии с построчным счётом и кошельком, который останавливается, когда деньги кончаются.
Одной фразой
Если когда-нибудь нужно было сделать материал в смешанной медиаформе и приходилось либо платить $200/мес подпиской, либо склеивать пять бесплатных тиров за выходные — Franklin это та же работа, но «как один инструмент». «Инструмент» — это кошелёк, который умеет тратить себя на результат.
$11.97. Один терминал. Один агент. Одно видео.
Попробуй на чём-то своём.
