한국어
Field Notes2026년 4월 15일 · 9 min

Franklin에게 $20과 스크립트를 주었더니, 3시간 후 영상이 있었다

대부분의 에이전트는 코드에서 멈춘다. Franklin은 그러지 않는다 — 스크립트를 사고, gpt-image-2로 스토리보드를 만들고, Seedance로 클립을 렌더링하고, 내레이션을 녹음하고, 음악을 라이선스한다. 모두 하나의 지갑에서. 정확한 명세서와 다른 에이전트가 만들 수 없는 이유.

Franklin에게 $20과 스크립트를 주었더니, 3시간 후 영상이 있었다

Franklin에 관한 영상이 될 예정이 아니었다. 사내 실험으로 시작됐다: 생각해낼 수 있는 가장 제작 부담이 큰 창작 작업 — 60초 내레이션, 음악, 오리지널 비주얼이 있는 설명 영상 — 을 단일 에이전트가 끝까지 만들 수 있는지 보기. 제약은 의도적으로 빡빡했다. 터미널 하나. 지갑 하나. $20에 캡된 USDC 잔고. 이미지 API 계정 없음, ElevenLabs 구독 없음, Seedance 로그인 없음, Soundstripe 라이선스 없음, Adobe 좌석 없음. 에이전트는 필요한 모든 도구를 찾고, 결제하고, 출하해야 했다.

3시간 후 영상은 디스크에 있었다. 지갑은 $11.97을 보여줬다. 영수증 — 모든 프롬프트, 모든 모델, 모든 유료 자산 — 은 Franklin이 작업하면서 출력한 단일 텍스트 파일이었다. 이게 그 파일, 각 줄 뒤의 이야기와 함께.

이게 우리가 출하한 가장 명확한 "지갑을 가진 에이전트"가 슬로건이 아닌 이유의 데모다. "당신을 도와주는 AI 도구"와 "일을 끝내는 AI 도구"의 구조적 차이.

브리프

> 비크립토 개발자 청중을 위한 60초 설명 영상.
  주제: 왜 pay-per-call AI가 미래인가, USDC가 레일.
  스타일: 미니멀 지폐 미학, 잉크 위 금색, 느린 카메라 무브.
  납품: 최종 mp4, 음악, 내레이션, 키프레임 정지화 3장.
  예산: $20 USDC. 하드 캡.

Franklin에 입력한 건 이게 전부.

영수증, 순서대로

Step 1 — 리서치와 아웃라인

✓ WebSearch  "USDC AI micropayments 2026"      $0.0008
✓ WebFetch   3 articles + Franklin docs         $0.0003
✓ Reason     outline 4 beats (nemotron, free)   $0.0000

$0.0011. 계획은 무료 NVIDIA Nemotron. 팩트체크 검색만 USDC.

Step 2 — 스크립트 다듬기

✓ Compose   60s narration (claude-sonnet-4.6)   $0.0089

내레이션은 Sonnet 으로 에스컬레이션. 1센트. 152단어, 60초 차분한 음성에 딱.

Step 3 — 키프레임 (gpt-image-2)

✓ ImageGen  3 banknote stills (gpt-image-2, hd) $0.3600

Franklin이 DALL-E 3 가 아닌 openai/gpt-image-2 선택 — 이미지 안에 "franklin · dispatch" 텍스트를 새겨야 했고, 이미지 내 텍스트를 안정적으로 렌더링하는 모델은 현재 gpt-image-2 뿐이다. 다국어와 프레임 간 캐릭터 일관성도 핵심. HD 3장 $0.36. 1장 거부, 재생성 +$0.12, 청구 전 표시.

Step 4 — 음성 생성

✓ Voice     ElevenLabs, voice "Adam" v2 (60s)   $0.4200

ElevenLabs 계정도 별도 API 키도 별도 카드도 없음. Franklin은 모델과 같은 x402 마이크로페이먼트 레일로 호출. 60초 $0.42. .env에 키 없음.

Step 5 — 비디오 클립 (Seedance)

✓ Video     bytedance/seedance-2.0-fast  3×10s  $4.5000
✓ Video     bytedance/seedance-2.0       2×10s  $6.0000

5개의 10초 720p 비디오, Seedance 두 티어에 걸쳐 혼합 — 추상적 모션 샷 3개는 bytedance/seedance-2.0-fast ($0.15/초), 캐릭터 중심 샷 2개는 bytedance/seedance-2.0 Pro ($0.30/초). 비디오 총 $10.50.

라우터는 캐릭터 충실도가 중요한 2개 샷에서만 Pro로 업그레이드, 모션이 캐리하는 3개는 절반 가격 -fast 사용. 정산 전 샷별 모델 선택과 "항상 Pro" 대비 절약 출력.

Step 6 — 음악

✓ Audio     Stable Audio, 60s instrumental      $0.1800

18센트 현악. Franklin이 내레이션 오디오에서 BPM을 계산한 후 의뢰.

Step 7 — 조립

✓ Bash      ffmpeg compose final mp4            $0.0000
✓ Bash      verify duration 60s                 $0.0000

로컬 FFmpeg, 무료. 59.4초, 18.2MB MP4, 720p, 자막 임베드.

총합

─────────────────────────────────────────────
세션 합계                              $11.97
  리서치 + 스크립트            $0.01
  키프레임 (gpt-image-2)        $0.36
  내레이션 (ElevenLabs)         $0.42
  비디오 (Seedance 믹스)       $10.50
  음악 (Stable Audio)           $0.18
  조립                          $0.00
지갑 잔고                              $8.03
하드 캡 존중 ✓
경과 시간                          3h 11m
─────────────────────────────────────────────

다른 모든 코딩 에이전트가 멈추는 곳

코드. 모두 코드에서 멈춘다. Cursor는 스크립트를 쓸 수 있다 — 음성에 결제할 수 없다. Claude Code는 4 비트를 개요할 수 있다 — 스토리보드를 생성할 수 없다. Copilot은 FFmpeg 명령을 제안할 수 있다 — 음악을 라이선스할 수 없다. 그들 뒤에는 결제 레이어가 없다.

옛 방식으로 같은 영상의 5단계 함정:

  1. ElevenLabs 가입, 카드, $10 최저 충전, .env에 키 복사.
  2. Seedance 리셀러 찾기 (직접 소매 거의 없음), 카드, 키 복사.
  3. OpenAI에서 gpt-image-2 액세스 신청, 카드, 조직 생성, 이미지 생성 액세스 심사 대기, 키 복사.
  4. Stable Audio 가입, 카드, $9 크레딧 팩 구매.
  5. .env 5줄을 셸 세션에 편집, Slack에 붙여넣지 않기 기도.

시작 전 시간: 45–90분. 고정 월별: $54+. 모두 액세스 세금.

Franklin: 총 $11.97. 구독 없음. .env에 자격 증명 없음. 지갑이 API 키.

왜 gpt-image-2 + Seedance, 구체적으로

gpt-image-2 는 이미지 내 판독 가능한 텍스트를 어떤 언어로든 철자 오류 없이 렌더링하는 최초의 일반 사용 가능 이미지 모델. 지폐 조각, 패키지, 포스터, 소셜 카드, 이중언어 사이니지 — 10% 개선이 아니라 "사용 가능"과 "사용 불가"의 차이. 같은 세션에서 프레임 간 캐릭터 ID 안정. HD 당 $0.06–$0.12.

Seedance 2.0 은 현재 오픈 시장 최고 가격/품질 비디오 모델. 완전 2.0 Pro 티어는 720p 비디오 출하, 5배 가격 모델에 대항. -fast 변형 $0.15/초는 B-롤과 모션 헤비 추상 샷의 새 스위트 스팟. 둘 다 최대 10초 클립, 둘 다 시드 이미지 수용, 둘 다 비동기 실행하며 게이트웨이가 최종 MP4를 영구 저장소로 미러링.

Franklin 의 일은 샷별로 두 개 사이에서 선택하는 것. 이번 5 샷 모두 정확히 선택. 그게 멀티모델의 핵심 — "많은 모델이 존재한다"가 아니라 "에이전트가 당신이 지명하지 않아도 정확히 선택한다".

이 패턴으로 무엇을 할 수 있나

  • 제품 출시 트레일러 (60초, 720p) — $12–$25
  • 3개 언어 온보딩 영상 — $25–$45
  • Substack 주간 설명자 — $8–$15
  • 10분 YouTube 에세이 — $50–$100
  • 오디오북 챕터 — $0.60–$1.20

이전엔 영수증 폴더, 대시보드 탭, 월 $200 구독 바닥이 필요했다. 지금 각각은 단일 franklin 세션, 항목별 청구서, 돈 떨어진 순간 멈추는 지갑.

한마디로

미디어 혼합 콘텐츠를 만들어야 했고 결국 월 $200 구독을 내거나 주말을 5개 무료 티어 접착에 쓴 적이 있다면 — Franklin은 그 워크플로우가 "하나의 도구로 느껴지는" 버전. "도구"는 결과를 향해 스스로 돈 쓰는 법을 아는 지갑.

$11.97. 터미널 하나. 에이전트 하나. 영상 하나.

당신 자신의 것에 시도해보라.

지금 시도

Franklin 설치

두 명령어. 무료 티어가 즉시 작동. 지갑은 자동 생성.

$ npm install -g @blockrun/franklin
$ franklin

#franklin#video-production#field-notes#case-study#gpt-image-2#seedance#yopo