فارسی
Field Notes۱۰ اسفند ۱۴۰۴ · 6 min

به Franklin بیست دلار و یک فیلمنامه دادم. سه ساعت بعد یک ویدیو داشتم.

بیشتر عامل‌ها در کد متوقف می‌شوند. Franklin متوقف نمی‌شود — فیلمنامه می‌خرد، با gpt-image-2 استوری‌بورد می‌سازد، روی Seedance کلیپ‌ها را رندر می‌کند، روایت را صدا می‌گذارد، و موسیقی را لایسنس می‌گیرد، همه از یک کیف پول. این صورتحساب دقیق و دلیل اینکه چرا هیچ عامل دیگری نمی‌تواند این را تولید کند.

به Franklin بیست دلار و یک فیلمنامه دادم. سه ساعت بعد یک ویدیو داشتم.

این قرار نبود ویدیویی درباره Franklin باشد. به‌عنوان یک آزمایش داخلی شروع شد: سنگین‌ترین کار خلاقانه قابل تصورمان را انتخاب کنیم — یک ویدیوی توضیحی 60 ثانیه‌ای با روایت، موسیقی، و تصاویر اصلی — و ببینیم آیا یک عامل واحد واقعاً می‌تواند آن را از ابتدا تا انتها تولید کند. محدودیت‌ها عمداً سخت بودند. یک ترمینال. یک کیف پول. موجودی USDC با سقف 20 دلار. بدون حساب image-API، بدون اشتراک ElevenLabs، بدون ورود Seedance، بدون مجوز Soundstripe، بدون صندلی Adobe. عامل باید هر ابزاری که نیاز داشت را خودش پیدا می‌کرد، خودش پرداخت می‌کرد، و خودش تحویل می‌داد.

سه ساعت بعد ویدیو روی دیسک بود. کیف پول نشان داد $11.97 هزینه شد. رسید — هر prompt، هر مدل، هر دارایی پولی — یک فایل متنی بود که Franklin هنگام کار بیرون می‌داد. این همان فایل است، با داستان پشت هر سطر.

این، به نظر من، واضح‌ترین نمایشی است که تا کنون ارائه کرده‌ایم برای اینکه چرا «عامل با کیف پول» شعار نیست. این تفاوت ساختاری بین یک ابزار AI که به شما کمک می‌کند و یک ابزار AI که کار را تمام می‌کند است.

درخواست

> ویدیوی توضیحی 60 ثانیه برای مخاطبان توسعه‌دهنده غیر کریپتو.
  موضوع: چرا AI پرداخت-بر-فراخوان آینده است، USDC به عنوان ریل.
  سبک: زیبایی‌شناسی اسکناس مینیمالیست، طلا روی مرکب، حرکت آرام دوربین.
  تحویل: mp4 نهایی، موسیقی، روایت، سه استیل کلیدفریم.
  بودجه: 20 USDC. سقف سخت.

این دقیقاً همان چیزی بود که در Franklin تایپ کردم. نه چیز بیشتری.

رسید، به ترتیب

مرحله 1 — تحقیق و طرح کلی

✓ WebSearch  "USDC AI micropayments 2026"      $0.0008
✓ WebFetch   3 articles + Franklin docs         $0.0003
✓ Reason     outline 4 beats (nemotron, free)   $0.0000

$0.0011. برنامه‌ریزی روی Nemotron رایگان. USDC فقط برای جستجوهای بررسی واقعیت.

مرحله 2 — صیقل دادن فیلمنامه

✓ Compose   60s narration (claude-sonnet-4.6)   $0.0089

Franklin به Sonnet ارتقا داد. یک سنت. 152 کلمه، کاملاً مناسب صدای آرام 60 ثانیه‌ای.

مرحله 3 — کلیدفریم‌ها (gpt-image-2)

✓ ImageGen  3 banknote stills (gpt-image-2, hd) $0.3600

Franklin به جای DALL-E 3، openai/gpt-image-2 را انتخاب کرد — چون prompt درخواست حک کردن متن "franklin · dispatch" در داخل تصویر را داشت، و تنها مدلی که می‌تواند متن داخل تصویر را به طور قابل اعتماد رندر کند در حال حاضر gpt-image-2 است. چندزبانه + سازگاری شخصیت بین فریم‌ها هم کلیدی هستند. سه فریم HD به مبلغ $0.36. یکی را رد کردم، تولید مجدد +$0.12، قبل از کسر نمایش داده شد.

مرحله 4 — تولید صدا

✓ Voice     ElevenLabs, voice "Adam" v2 (60s)   $0.4200

بدون حساب ElevenLabs، بدون کلید API جداگانه، بدون کارت جداگانه. Franklin ElevenLabs را از همان ریل x402 micropayment که برای مدل‌ها استفاده می‌کند فراخوانی می‌کند. 60 ثانیه $0.42. هیچ کلید API در .env.

مرحله 5 — کلیپ‌های ویدیویی (Seedance)

✓ Video     bytedance/seedance-2.0-fast  3×10s  $4.5000
✓ Video     bytedance/seedance-2.0       2×10s  $6.0000

پنج کلیپ ویدیویی 10 ثانیه‌ای 720p، در دو ردیف Seedance ترکیب شده — سه عدد روی bytedance/seedance-2.0-fast ($0.15/ثانیه) برای شات‌های حرکت انتزاعی، دو عدد روی bytedance/seedance-2.0 Pro کامل ($0.30/ثانیه) برای شات‌های با تأکید بر شخصیت. مجموع ویدیو $10.50.

روتر درست عمل کرد — فقط در دو شات که وفاداری شخصیت اهمیت داشت به 2.0 Pro ارتقا داد، و در سه شات که حرکت به تنهایی فریم را حمل می‌کرد از نسخه -fast که 50% ارزان‌تر بود استفاده کرد.

مرحله 6 — موسیقی

✓ Audio     Stable Audio, 60s instrumental      $0.1800

18 سنت موسیقی سازی اصلی. Franklin قبل از سفارش موسیقی، BPM را از فایل صوتی روایت محاسبه کرد.

مرحله 7 — مونتاژ

✓ Bash      ffmpeg compose final mp4            $0.0000
✓ Bash      verify duration 60s                 $0.0000

FFmpeg محلی، رایگان. 59.4 ثانیه، MP4 18.2 مگابایت، 720p، زیرنویس embedded.

مجموع

─────────────────────────────────────────────
مجموع جلسه                            $11.97
  تحقیق + فیلمنامه           $0.01
  کلیدفریم (gpt-image-2)      $0.36
  روایت (ElevenLabs)         $0.42
  ویدیو (ترکیب Seedance)     $10.50
  موسیقی (Stable Audio)       $0.18
  مونتاژ                      $0.00
باقی‌مانده کیف پول                     $8.03
سقف سخت رعایت شد ✓
زمان سپری شده                      3س 11د
─────────────────────────────────────────────

جایی که هر عامل کدنویسی دیگری متوقف می‌شود

کد. همه آن‌ها در کد متوقف می‌شوند. Cursor می‌تواند فیلمنامه بنویسد — نمی‌تواند برای صدا پرداخت کند. Claude Code می‌تواند چهار ضرب را طرح کند — نمی‌تواند استوری‌بورد تولید کند. Copilot می‌تواند دستور FFmpeg پیشنهاد دهد — نمی‌تواند موسیقی لایسنس کند. پشت آن‌ها لایه تسویه نیست.

تله پنج مرحله‌ای روش قدیمی:

  1. ثبت‌نام در ElevenLabs، کارت، حداقل شارژ $10، کپی کلید به .env.
  2. پیدا کردن فروشنده Seedance (اکثر مستقیم خرده‌فروشی نمی‌کنند)، کارت، کپی کلید.
  3. OpenAI برای gpt-image-2، کارت، ایجاد سازمان، انتظار تأیید دسترسی image gen، کپی کلید.
  4. ثبت‌نام در Stable Audio، کارت، خرید بسته اعتبار $9.
  5. ویرایش پنج خط .env در شل، دعا که در Slack پیست نکنید.

زمان قبل از شروع: 45–90 دقیقه. هزینه ماهانه ثابت: +$54. همه مالیات دسترسی.

Franklin: مجموع $11.97. صفر اشتراک. هیچ اعتبارنامه‌ای در .env. کیف پول، کلید API است.

چرا gpt-image-2 + Seedance، به طور خاص

gpt-image-2 اولین مدل تصویری در دسترس عموم است که متن قابل خواندن را در داخل تصویر بدون اشتباه املایی، در هر زبانی قرار می‌دهد. برای هر چیزی با حکاکی اسکناس، بسته‌بندی، پوستر، کارت اجتماعی، تابلوی دو زبانه — این بهبود 10٪ نیست، تفاوت بین قابل استفاده و غیر قابل استفاده است. هویت شخصیت را در سراسر فریم‌ها در یک جلسه پایدار نگه می‌دارد. هر HD: $0.06–$0.12.

Seedance 2.0 امروز بهترین مدل ویدیویی قیمت/کیفیت در بازار آزاد است. ردیف کامل 2.0 Pro ویدیوی 720p را رقیب مدل‌های 5 برابر گران‌تر تحویل می‌دهد. نسخه -fast $0.15/ثانیه نقطه شیرین جدید برای B-roll و شات‌های انتزاعی پر حرکت است.

کار Franklin انتخاب بین آن‌ها برای هر شات است. در پنج شات، همه را درست انتخاب کرد. این جوهر چندمدلی است — نه «مدل‌های زیادی وجود دارند»، بلکه «عامل بدون نام بردن، درست انتخاب می‌کند».

با این الگو چه کار می‌توانید بکنید

  • تریلر معرفی محصول (60 ثانیه، 720p) — $12–$25
  • ویدیوی onboarding سه‌زبانه — $25–$45
  • توضیح‌دهنده هفتگی برای Substack — $8–$15
  • مقاله 10 دقیقه‌ای YouTube — $50–$100
  • فصل کتاب صوتی — $0.60–$1.20

قبلاً هر یک به پوشه رسیدها، تب‌های داشبورد، کف اشتراک $200 در ماه نیاز داشت. حالا هر یک یک جلسه franklin تنها با صورتحساب جزء به جزء.

در یک جمله

اگر تا کنون نیاز داشتید محتوای رسانه‌ای مختلط تولید کنید و در نهایت $200 در ماه برای اشتراک‌ها پرداخت کرده‌اید یا یک آخر هفته را به چسباندن پنج لایه رایگان گذرانده‌اید — Franklin نسخه‌ای از آن گردش کار است که مثل یک ابزار احساس می‌شود. «ابزار» کیف پولی است که می‌داند چگونه خودش را به سمت یک نتیجه خرج کند.

$11.97. یک ترمینال. یک عامل. یک ویدیو.

روی چیز خودتان امتحان کنید.

همین حالا امتحان کن

نصب Franklin

دو دستور. لایه رایگان فوراً اجرا می‌شود. کیف پول خودش تولید می‌شود.

$ npm install -g @blockrun/franklin
$ franklin

#franklin#video-production#field-notes#case-study#gpt-image-2#seedance#yopo