Русский
Field Notes11 апреля 2026 г. · 5 min

Я дал Franklin $20 и сценарий. Через три часа у меня было видео.

Большинство агентов останавливаются на коде. Franklin не останавливается — он покупает сценарий, делает раскадровку с gpt-image-2, рендерит клипы на Seedance, озвучивает закадровый текст, лицензирует музыку, всё из одного кошелька. Точная роспись расходов и почему ни один другой агент это не сделал бы.

Я дал Franklin $20 и сценарий. Через три часа у меня было видео.

Это не должно было быть видео про Franklin. Начали как внутренний эксперимент: взять самую тяжёлую творческую задачу, которую можем придумать — 60-секундный объяснительный ролик с озвучкой, музыкой и оригинальной графикой — и проверить, может ли один агент действительно сделать всё от начала до конца. Ограничения жёсткие. Один терминал. Один кошелёк. Баланс USDC с потолком в $20. Никаких аккаунтов на image-API, никакой подписки ElevenLabs, никакого логина в Seedance, никакой лицензии Soundstripe, никакого Adobe. Агент должен был сам найти каждый инструмент, сам заплатить и сдать.

Через три часа видео лежало на диске. Кошелёк показывал, что на это ушло $11.97. Чек — каждый промпт, каждая модель, каждый платёж — был одним текстовым файлом, который Franklin выводил по ходу. Это и есть тот файл, с историей за каждой строкой.

Это, на мой взгляд, самая чистая демонстрация того, почему «агент с кошельком» не слоган. Это структурная разница между AI-инструментом, который тебе помогает, и AI-инструментом, который доводит работу до конца.

Бриф

> 60-секундное объясняющее видео для разработчиков без крипто-фона.
  Тема: почему pay-per-call AI — будущее, USDC — рельса.
  Стиль: минималистичная банкнотная эстетика, золото на чернилах.
  Сдача: финальный mp4, музыка, озвучка, 3 ключевых кадра.
  Бюджет: $20 USDC. Жёсткий потолок.

В Franklin я набрал ровно это. Больше ничего.

Чек, по порядку

Шаг 1 — Ресерч и аутлайн

✓ WebSearch  "USDC AI micropayments 2026"      $0.0008
✓ WebFetch   3 articles + Franklin docs         $0.0003
✓ Reason     outline 4 beats (nemotron, free)   $0.0000

$0.0011. Планирование на бесплатном Nemotron, USDC ушёл только на факт-чек.

Шаг 2 — Полировка сценария

✓ Compose   60s narration (claude-sonnet-4.6)   $0.0089

На текст озвучки Franklin эскалировался к Sonnet. Один цент. 152 слова, ровно под спокойный 60-секундный голос.

Шаг 3 — Ключевые кадры (gpt-image-2)

✓ ImageGen  3 banknote stills (gpt-image-2, hd) $0.3600

Franklin выбрал openai/gpt-image-2, а не DALL-E 3 — потому что в промпте требовалось вживить текст «franklin · dispatch» в банкнотную графику, а из доступных моделей текст в картинке без ошибок умеет рисовать только gpt-image-2. Многоязычность и стабильность персонажа между кадрами — туда же. Три HD-кадра $0.36. Один отбраковал, регенерация +$0.12, всё всплыло до списания.

Шаг 4 — Озвучка

✓ Voice     ElevenLabs, voice "Adam" v2 (60s)   $0.4200

Никакого аккаунта ElevenLabs, отдельного API-ключа и карты. Franklin зовёт ElevenLabs тем же x402-микроплатежом. 60 секунд — $0.42. В .env ключа нет.

Шаг 5 — Видео-клипы (Seedance)

✓ Video     bytedance/seedance-2.0-fast  3×10s  $4.5000
✓ Video     bytedance/seedance-2.0       2×10s  $6.0000

Пять 10-секундных 720p видео, смешанных по двум тирам Seedance — три на bytedance/seedance-2.0-fast ($0.15/сек) для абстрактных движений, два на полный bytedance/seedance-2.0 Pro ($0.30/сек) для кадров с персонажем. Видео всего: $10.50.

Роутер апгрейднулся на 2.0 Pro только в двух кадрах, где важна персонажная верность, а в трёх «движение само вытаскивает» использовал -fast в два раза дешевле. Перед расчётом распечатался выбор по каждому кадру и экономия против «всегда Pro».

Шаг 6 — Музыка

✓ Audio     Stable Audio, 60s instrumental      $0.1800

18 центов оригинальной струнной. Franklin сначала вычислил BPM из аудио озвучки, потом заказал.

Шаг 7 — Сборка

✓ Bash      ffmpeg compose final mp4            $0.0000
✓ Bash      verify duration 60s                 $0.0000

Локальный FFmpeg, бесплатно. 59.4 секунды, 18.2 MB MP4, 720p, встроенные сабы.

Итог

─────────────────────────────────────────────
Сессия итого                          $11.97
  ресерч + сценарий           $0.01
  кадры (gpt-image-2)         $0.36
  озвучка (ElevenLabs)        $0.42
  видео (Seedance микс)      $10.50
  музыка (Stable Audio)       $0.18
  сборка                      $0.00
Остаток в кошельке                     $8.03
Жёсткий потолок соблюдён ✓
Время                              3ч 11мин
─────────────────────────────────────────────

Где останавливаются все остальные кодинг-агенты

На коде. Все они останавливаются на коде. Cursor напишет тебе сценарий — но не оплатит озвучку. Claude Code разложит четыре биты — но не сделает раскадровку. Copilot подскажет команду FFmpeg — но не лицензирует музыку. Под ними нет слоя расчётов.

По старому пять шагов:

  1. ElevenLabs: регистрация, карта, минимум $10, ключ в .env.
  2. Реселлер Seedance (прямых розничных почти нет): карта, ключ.
  3. OpenAI: запрос на доступ к gpt-image-2, карта, организация, ожидание модерации, ключ.
  4. Stable Audio: регистрация, карта, $9 пакет.
  5. Пять строк в .env, не вставить в Slack.

До старта работы: 45–90 минут. Фиксированно в месяц: $54+. Это всё налог на доступ.

Franklin: $11.97 итого. Никаких подписок. Никаких credentials в .env. Кошелёк — это ключ.

Почему именно gpt-image-2 + Seedance

gpt-image-2 — первая массово доступная модель, которая рендерит читаемый текст внутри картинки на любом языке без опечаток. Банкнота, упаковка, постер, соцкарта, двуязычная вывеска — это не +10%, это разница между «годится» и «нет». В рамках одной сессии стабильно держит идентичность персонажа между кадрами. HD: $0.06–$0.12.

Seedance 2.0 — сейчас лучшая в открытом рынке цена/качество для видео. Полный 2.0 Pro выдаёт 720p, конкурируя с моделями в 5× дороже. Вариант -fast за $0.15/сек — новая золотая середина для B-roll и абстрактного движения. До 10 секунд клипа, image-to-video через seed-картинку, асинхронные джобы с зеркалированием MP4 в постоянное хранилище.

Работа Franklin — выбирать между ними покадрово. В этом видео все пять кадров выбраны верно. Это и есть мульти-модель — не «много моделей существуют», а «агент выбирает правильно сам».

Что ещё с этим делается

  • Промо-ролик продукта (60с, 720p) — $12–$25
  • Онбординг-видео на трёх языках — $25–$45
  • Еженедельный объяснитель для Substack — $8–$15
  • 10-минутное эссе на YouTube — $50–$100
  • Глава аудиокниги — $0.60–$1.20

Каждое из этого раньше требовало папки чеков и подписочного пола в $200/мес. Сейчас — отдельные franklin-сессии с построчным счётом и кошельком, который останавливается, когда деньги кончаются.

Одной фразой

Если когда-нибудь нужно было сделать материал в смешанной медиаформе и приходилось либо платить $200/мес подпиской, либо склеивать пять бесплатных тиров за выходные — Franklin это та же работа, но «как один инструмент». «Инструмент» — это кошелёк, который умеет тратить себя на результат.

$11.97. Один терминал. Один агент. Одно видео.

Попробуй на чём-то своём.

Попробовать сейчас

Установить Franklin

Две команды. Бесплатный тир работает сразу. Кошелёк создаётся автоматически.

$ npm install -g @blockrun/franklin
$ franklin

#franklin#video-production#field-notes#case-study#gpt-image-2#seedance#yopo