استفاده روزافزون از ابزارهای تولید ویدیوی مبتنی بر هوش مصنوعی به ظهور یک روند ویروسی جدید تبدیل شده است: پادکست‌هایی با نوزادان مجازی که با صدای مصنوعی صحبت می‌کنند. یکی از شرکت‌هایی که به هنرمندان در این زمینه کمک می‌کند، استارتاپ «هدرا» است. این شرکت که در سال 2023 راه‌اندازی شده، یک مجموعه ویرایش و تولید ویدیوی تحت وب را با استفاده از مدل «Character-3» عرضه کرده است. این فناوری به کاربران اجازه می‌دهد ویدیوهایی با شخصیت‌های تولید شده توسط هوش مصنوعی بسازند و همچنین سبک‌ها را در میان تصاویر و صداها منتقل کنند. به عنوان مثال، اخیراً ویدیویی منتشر شد که در آن یک سگ مجازی درباره زندگی با یک نوزاد جدید صحبت می‌کند.

هرچند هنوز مشخص نیست که هدرا چقدر از این روند بهره‌مند شده، اما توجه سرمایه‌گذاران را به خود جلب کرده است. این شرکت روز پنج‌شنبه اعلام کرد که 32 میلیون دلار در دور تأمین مالی سری A از سوی fund زیرساخت شرکت «آندرستین هورویتز» جذب کرده است. سرمایه‌گذاران پیشین این شرکت نیز در این دور سرمایه‌گذاری مشارکت دارند و مت بورنستین از a16z به هیئت‌مدیره هدرا خواهد پیوست. مایکل لینگلباخ، بنیان‌گذار و مدیرعامل این شرکت، در گفتگو با TechCrunch بیان کرد که این استارتاپ در پی شناخت فاصله‌ای که بین شرکت‌هایی مانند «سنتزیا» که به کاربران اجازه می‌دهند آواتارهای تولید شده توسط هوش مصنوعی را بر روی ارائه‌ها قرار دهند و استارتاپ‌هایی مانند «ران‌وی» که ابزارهای تولید ویدیوی کوتاه ارائه می‌دهند، الهام گرفته است. او گفت: “اگر ما در تقاطع تولید ویدیو و شخصیت‌های سه‌بعدی با دیالوگ‌های طولانی و کنترل‌پذیری بهتر کاری کنیم، چه می‌شود؟”

هدرا اولین مدل ویدیویی خود را در ژوئن 2024 راه‌اندازی کرد و به سرعت توجه سرمایه‌گذاران را جلب کرد و 10 میلیون دلار سرمایه اولیه از Index Ventures، Abstract Ventures و a16z دریافت کرد. در اوایل امسال، آمازون نیز از طریق بازوی سرمایه‌گذاری خود، «صندوق الکسا»، از این شرکت حمایت کرد. لینگلباخ اشاره کرد که راه‌اندازی مدل «Character-3» در ماه مارس نقطه عطفی برای شرکت بود و هم‌اکنون موتور رشد کاربران را هدایت می‌کند. این استارتاپ قصد دارد از سرمایه جدید برای آموزش مدل بعدی خود استفاده کند که به گفته آنها، امکان سفارشی‌سازی بهتر و توسعه فناوری برای تعامل شخصیت‌های تولید شده با کاربران را فراهم می‌کند.

هدرا اکنون بر جذب خالقان و مصرف‌کنندگان حرفه‌ای تمرکز دارد و همچنین از دریافت علاقه‌مندی‌های غیرمستقیم از دپارتمان‌های مارکتینگ شرکت‌ها خبر داده است. در حالی که مدل‌های خود هدرا بر روی حرکات و ابراز احساسات شخصیت‌ها متمرکز است، این اپلیکیشن اجازه می‌دهد از مدل‌های دیگری مانند Veo 2 و Kling برای تولید ویدیو، Flux، Imagen3، Sana و Ideogram V2 برای تولید تصویر و مدل‌های صوتی از ElevenLabs و Cartesia برای تولید یا کپی صدا استفاده کنید.

رقبای هدرا شامل «کپشنز» که به‌طور خاص بر روی گوشی‌های هوشمند تمرکز دارد، «چی‌هوا» که از استودیوهای هالیوود برای ایجاد ویژگی‌های انیمیشنی همکاری می‌کند، «سنتزیا» و «هی‌جن» هستند. هدرا ادعا می‌کند ویدیوهای تولید شده با پلتفرم خود، شخصیت‌های بیشتری با احساسات دارد نسبت به رقبا. مت بورنستین از a16z بر این باور است که با تکامل فضای تولید ویدیوی مبتنی بر هوش مصنوعی، ابزارهای بیشتری را خواهیم دید که بر روی شخصیت‌ها، حرکات، صدا، و ویرایش متمرکز هستند. او در بیانیه‌ای به TechCrunch گفت: “شرکت‌های هوش مصنوعی می‌توانند کلیپ‌های فوق‌العاده‌ای از محیط‌ها و حرکات ساده تولید کنند، اما نمی‌توانند دیالوگ یا انیمیشن معناداری ایجاد کنند. این فقط درباره ساخت یک ویدیو نیست، بلکه درباره ساخت داستانی است که مخاطب را درگیر کند و این به مردم و شخصیت‌ها در داستان بستگی دارد؛ دقیقاً چیزی که هدرا در حال ساخت آن است.”

متن خود را با هوش مصنوعی به تصویر تبدیل کنید

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا