لایتریکس: تولید ویدیو با هوش مصنوعی ۳۰ برابر سریع‌تر شد، بدون نیاز به GPU ۱۰ هزار دلاری

شرکت Lightricks، خالق اپلیکیشن‌های خلاقانه مانند Facetune و VideoLeap، امروز از مدل جدید و قدرتمند ویدیوی هوش مصنوعی خود با نام LTX Video 13B رونمایی کرد. این مدل که شامل ۱۳ میلیارد پارامتر می‌باشد، قادر است ویدیوهای هوش مصنوعی را تا ۳۰ بار سریع‌تر از مدل‌های مشابه تولید کند و این کار را بر روی سخت‌افزارهای مصرفی انجام می‌دهد و نیازی به پردازنده‌های گران‌قیمت ندارد.

مدل جدید با معرفی “رندرینگ چند مقیاسی” بهبود قابل توجهی در کارایی و سرعت ایجاد ویدیوها را فراهم می‌کند. این تکنیک امکان تولید ویدیو را در لایه‌های مختلف جزئیات می‌دهد و به سازندگان محتوا این امکان را می‌دهد تا ویدیوهای با کیفیت حرفه‌ای را تنها با استفاده از کامپیوترهای معمولی و لپ‌تاپ‌های پیشرفته تولید کنند.

زیو فاربمن، هم‌بنیان‌گذار و مدیرعامل Lightricks، در مصاحبه‌ای اختصاصی با VentureBeat گفت: «معرفی مدل ویدیو LTX با ۱۳ میلیارد پارامتر، نقطه عطفی در تولید ویدیو با هوش مصنوعی است و اکنون کاربران می‌توانند محتوایی با کیفیت بهتر و کنترل دقیق‌تر تولید کنند.»

یکی از چالش‌های بزرگ تولید ویدیو با هوش مصنوعی، نیازهای محاسباتی فراوان است. مدل‌های پیشرفته مانند Runway و Pika معمولاً در فضای ابری و بر روی چندین پردازنده گران‌قیمت کار می‌کنند که این امر، پیاده‌سازی محلی را برای بسیاری از کاربران غیرممکن می‌سازد. در حالی که فاربمن توضیح داد که LTXV-13B این محدودیت‌ها را برطرف کرده است.

این مدل به شکلی طراحی شده که به طور مؤثری با محدودیت‌های سخت‌افزاری مصرفی سازگاری داشته باشد و به کاربران این امکان را می‌دهد که با استفاده از پردازنده‌های گرافیکی معمولی، ویدیوهایی با کیفیت بالا تولید کنند.

رندرینگ چند مقیاسی، که به عنوان بزرگ‌ترین پیشرفت تکنیکی این مدل معرفی شده است، به مدل این امکان را می‌دهد که جزئیات را به طور تدریجی تولید کند. این فرآیند مشابه آن است که هنرمندان به هنگام کار بر روی صحنه‌های پیچیده، ابتدا طرح‌های اولیه را ترسیم کرده و سپس جزئیات بیشتری را اضافه می‌کنند.

مدل LTXV-13B به‌صورت کاملاً متن‌باز بر روی Hugging Face و GitHub در دسترس است. این تصمیم در شرایطی اتخاذ شده که توسعه هوش مصنوعی متن‌باز با چالش‌هایی از سوی رقابت‌های تجاری مواجه است. فاربمن اظهار داشت: «هدف از متن‌باز کردن این مدل، کاهش هزینه‌های تحقیق و توسعه است و این امکان را فراهم می‌آورد که افراد بیشتری در این حوزه از آن بهره‌برداری کنند.»

با توجه به چالش‌های قانونی پیرامون استفاده از داده‌های آموزشی، Lightricks با شرکت‌های Getty Images و Shutterstock برای دسترسی به محتوای مجوزدار برای آموزش مدل خود همکاری دارد. این شرکت در یک اقدام غیرمعمول برای صنعت هوش مصنوعی، مدل LTXV-13B را به‌صورت رایگان برای شرکت‌هایی با درآمد سالیانه کمتر از ۱۰ میلیون دلار ارائه کرده است.

با اینکه مدل LTXV-13B پیشرفت‌های چشمگیری را به همراه دارد، فاربمن بر این باور است که هنوز راهی تا تولید ویدیوهای مشابه هالیوودی وجود دارد، اما به کاربردهای عملی فوری در زمینه‌هایی مانند انیمیشن تاکید می‌کند.

مدل LTXV-13B هم‌اکنون به‌صورت متن‌باز در دسترس است و به‌زودی در اپلیکیشن‌های خلاقانه Lightricks، از جمله پلتفرم داستان‌سرایی LTX Studio، یکپارچه خواهد شد.

تبدیل گفتار به نوشتار فارسی

لایتریکس: تولید ویدیو با هوش مصنوعی ۳۰ برابر سریع‌تر شد، بدون نیاز به GPU ۱۰ هزار دلاری

دیدگاه‌ خود را بنویسید لغو پاسخ