استفاده روزافزون از ابزارهای تولید ویدیوی مبتنی بر هوش مصنوعی به ظهور یک روند ویروسی جدید تبدیل شده است: پادکستهایی با نوزادان مجازی که با صدای مصنوعی صحبت میکنند. یکی از شرکتهایی که به هنرمندان در این زمینه کمک میکند، استارتاپ «هدرا» است. این شرکت که در سال 2023 راهاندازی شده، یک مجموعه ویرایش و تولید ویدیوی تحت وب را با استفاده از مدل «Character-3» عرضه کرده است. این فناوری به کاربران اجازه میدهد ویدیوهایی با شخصیتهای تولید شده توسط هوش مصنوعی بسازند و همچنین سبکها را در میان تصاویر و صداها منتقل کنند. به عنوان مثال، اخیراً ویدیویی منتشر شد که در آن یک سگ مجازی درباره زندگی با یک نوزاد جدید صحبت میکند.
هرچند هنوز مشخص نیست که هدرا چقدر از این روند بهرهمند شده، اما توجه سرمایهگذاران را به خود جلب کرده است. این شرکت روز پنجشنبه اعلام کرد که 32 میلیون دلار در دور تأمین مالی سری A از سوی fund زیرساخت شرکت «آندرستین هورویتز» جذب کرده است. سرمایهگذاران پیشین این شرکت نیز در این دور سرمایهگذاری مشارکت دارند و مت بورنستین از a16z به هیئتمدیره هدرا خواهد پیوست. مایکل لینگلباخ، بنیانگذار و مدیرعامل این شرکت، در گفتگو با TechCrunch بیان کرد که این استارتاپ در پی شناخت فاصلهای که بین شرکتهایی مانند «سنتزیا» که به کاربران اجازه میدهند آواتارهای تولید شده توسط هوش مصنوعی را بر روی ارائهها قرار دهند و استارتاپهایی مانند «رانوی» که ابزارهای تولید ویدیوی کوتاه ارائه میدهند، الهام گرفته است. او گفت: “اگر ما در تقاطع تولید ویدیو و شخصیتهای سهبعدی با دیالوگهای طولانی و کنترلپذیری بهتر کاری کنیم، چه میشود؟”
هدرا اولین مدل ویدیویی خود را در ژوئن 2024 راهاندازی کرد و به سرعت توجه سرمایهگذاران را جلب کرد و 10 میلیون دلار سرمایه اولیه از Index Ventures، Abstract Ventures و a16z دریافت کرد. در اوایل امسال، آمازون نیز از طریق بازوی سرمایهگذاری خود، «صندوق الکسا»، از این شرکت حمایت کرد. لینگلباخ اشاره کرد که راهاندازی مدل «Character-3» در ماه مارس نقطه عطفی برای شرکت بود و هماکنون موتور رشد کاربران را هدایت میکند. این استارتاپ قصد دارد از سرمایه جدید برای آموزش مدل بعدی خود استفاده کند که به گفته آنها، امکان سفارشیسازی بهتر و توسعه فناوری برای تعامل شخصیتهای تولید شده با کاربران را فراهم میکند.
هدرا اکنون بر جذب خالقان و مصرفکنندگان حرفهای تمرکز دارد و همچنین از دریافت علاقهمندیهای غیرمستقیم از دپارتمانهای مارکتینگ شرکتها خبر داده است. در حالی که مدلهای خود هدرا بر روی حرکات و ابراز احساسات شخصیتها متمرکز است، این اپلیکیشن اجازه میدهد از مدلهای دیگری مانند Veo 2 و Kling برای تولید ویدیو، Flux، Imagen3، Sana و Ideogram V2 برای تولید تصویر و مدلهای صوتی از ElevenLabs و Cartesia برای تولید یا کپی صدا استفاده کنید.
رقبای هدرا شامل «کپشنز» که بهطور خاص بر روی گوشیهای هوشمند تمرکز دارد، «چیهوا» که از استودیوهای هالیوود برای ایجاد ویژگیهای انیمیشنی همکاری میکند، «سنتزیا» و «هیجن» هستند. هدرا ادعا میکند ویدیوهای تولید شده با پلتفرم خود، شخصیتهای بیشتری با احساسات دارد نسبت به رقبا. مت بورنستین از a16z بر این باور است که با تکامل فضای تولید ویدیوی مبتنی بر هوش مصنوعی، ابزارهای بیشتری را خواهیم دید که بر روی شخصیتها، حرکات، صدا، و ویرایش متمرکز هستند. او در بیانیهای به TechCrunch گفت: “شرکتهای هوش مصنوعی میتوانند کلیپهای فوقالعادهای از محیطها و حرکات ساده تولید کنند، اما نمیتوانند دیالوگ یا انیمیشن معناداری ایجاد کنند. این فقط درباره ساخت یک ویدیو نیست، بلکه درباره ساخت داستانی است که مخاطب را درگیر کند و این به مردم و شخصیتها در داستان بستگی دارد؛ دقیقاً چیزی که هدرا در حال ساخت آن است.”