شرکت Lightricks، خالق اپلیکیشنهای خلاقانه مانند Facetune و VideoLeap، امروز از مدل جدید و قدرتمند ویدیوی هوش مصنوعی خود با نام LTX Video 13B رونمایی کرد. این مدل که شامل ۱۳ میلیارد پارامتر میباشد، قادر است ویدیوهای هوش مصنوعی را تا ۳۰ بار سریعتر از مدلهای مشابه تولید کند و این کار را بر روی سختافزارهای مصرفی انجام میدهد و نیازی به پردازندههای گرانقیمت ندارد.
مدل جدید با معرفی “رندرینگ چند مقیاسی” بهبود قابل توجهی در کارایی و سرعت ایجاد ویدیوها را فراهم میکند. این تکنیک امکان تولید ویدیو را در لایههای مختلف جزئیات میدهد و به سازندگان محتوا این امکان را میدهد تا ویدیوهای با کیفیت حرفهای را تنها با استفاده از کامپیوترهای معمولی و لپتاپهای پیشرفته تولید کنند.
زیو فاربمن، همبنیانگذار و مدیرعامل Lightricks، در مصاحبهای اختصاصی با VentureBeat گفت: «معرفی مدل ویدیو LTX با ۱۳ میلیارد پارامتر، نقطه عطفی در تولید ویدیو با هوش مصنوعی است و اکنون کاربران میتوانند محتوایی با کیفیت بهتر و کنترل دقیقتر تولید کنند.»
یکی از چالشهای بزرگ تولید ویدیو با هوش مصنوعی، نیازهای محاسباتی فراوان است. مدلهای پیشرفته مانند Runway و Pika معمولاً در فضای ابری و بر روی چندین پردازنده گرانقیمت کار میکنند که این امر، پیادهسازی محلی را برای بسیاری از کاربران غیرممکن میسازد. در حالی که فاربمن توضیح داد که LTXV-13B این محدودیتها را برطرف کرده است.
این مدل به شکلی طراحی شده که به طور مؤثری با محدودیتهای سختافزاری مصرفی سازگاری داشته باشد و به کاربران این امکان را میدهد که با استفاده از پردازندههای گرافیکی معمولی، ویدیوهایی با کیفیت بالا تولید کنند.
رندرینگ چند مقیاسی، که به عنوان بزرگترین پیشرفت تکنیکی این مدل معرفی شده است، به مدل این امکان را میدهد که جزئیات را به طور تدریجی تولید کند. این فرآیند مشابه آن است که هنرمندان به هنگام کار بر روی صحنههای پیچیده، ابتدا طرحهای اولیه را ترسیم کرده و سپس جزئیات بیشتری را اضافه میکنند.
مدل LTXV-13B بهصورت کاملاً متنباز بر روی Hugging Face و GitHub در دسترس است. این تصمیم در شرایطی اتخاذ شده که توسعه هوش مصنوعی متنباز با چالشهایی از سوی رقابتهای تجاری مواجه است. فاربمن اظهار داشت: «هدف از متنباز کردن این مدل، کاهش هزینههای تحقیق و توسعه است و این امکان را فراهم میآورد که افراد بیشتری در این حوزه از آن بهرهبرداری کنند.»
با توجه به چالشهای قانونی پیرامون استفاده از دادههای آموزشی، Lightricks با شرکتهای Getty Images و Shutterstock برای دسترسی به محتوای مجوزدار برای آموزش مدل خود همکاری دارد. این شرکت در یک اقدام غیرمعمول برای صنعت هوش مصنوعی، مدل LTXV-13B را بهصورت رایگان برای شرکتهایی با درآمد سالیانه کمتر از ۱۰ میلیون دلار ارائه کرده است.
با اینکه مدل LTXV-13B پیشرفتهای چشمگیری را به همراه دارد، فاربمن بر این باور است که هنوز راهی تا تولید ویدیوهای مشابه هالیوودی وجود دارد، اما به کاربردهای عملی فوری در زمینههایی مانند انیمیشن تاکید میکند.
مدل LTXV-13B هماکنون بهصورت متنباز در دسترس است و بهزودی در اپلیکیشنهای خلاقانه Lightricks، از جمله پلتفرم داستانسرایی LTX Studio، یکپارچه خواهد شد.