گوگل به تازگی مدل هوش مصنوعی جدید Veo 2 را برای کاربران سرویس پیشرفته Gemini Advanced خود معرفی کرد. این گام تازه در راستای رقابت با پلتفرم تولید ویدئوی OpenAI به نام Sora صورت میگیرد و نشاندهنده رشد فزاینده رقابت در این حوزه است.
دو هفته پیش، یکی از شرکتهای پیشرو در زمینه رسانههای مصنوعی، Runway، نسل چهارم تولیدکننده ویدئوی خود را معرفی و بیش از 300 میلیون دلار سرمایه جدید جذب کرد. از روز سهشنبه، مشترکان Gemini Advanced میتوانند Veo 2 را از منوی مدلها در برنامههای Gemini انتخاب کنند. کاربران قادر خواهند بود کلیپهای ویدئویی هشتثانیهای با کیفیت 720p و نسبت ابعاد 16:9 ایجاد کرده و این کلیپها را از طریق دکمه “اشتراکگذاری” به پلتفرمهایی مانند TikTok و YouTube بارگذاری کنند. ویدئوهای تولید شده با Veo 2 همچنین میتوانند به عنوان فایلهای MP4 دانلود شوند که با تکنولوژی SynthID گوگل علامتگذاری شدهاند.
لازم به ذکر است که گوگل برای محدود کردن تعداد ویدیوهای قابل ایجاد در هر ماه، قوانینی را در نظر گرفته و در حال حاضر، برنامههای کسب و کار و آموزش Google Workspace پشتیبانی نمیشوند. به علاوه، گوگل در حال ادغام Veo 2 با ویژگی آزمایشی Whisk در Google Labs است که به کاربران اجازه میدهد از تصاویر به عنوان محرک استفاده کنند تا به ایجاد تصاویر جدید پرداخته شود. ویژگی جدید Whisk Animate به کاربران این امکان را میدهد که تصاویر ایجاد شده را به ویدئوهای هشتثانیهای تولید شده با Veo 2 تبدیل کنند.
به نظر میرسد کاربردهای فعلی Veo 2 از سوی گوگل همچنان ابتدایی باشد، اما دمیس هاسابی، مدیر عامل گوگل دیپ مایند، اخیراً اعلام کرد که این شرکت برنامه دارد تا مدلهای هوش مصنوعی Gemini را با Veo ترکیب کند تا درک بهتری از جهان فیزیکی ایجاد کند. در عین حال، بسیاری از هنرمندان و خالقان نسبت به تولیدکنندگان ویدئویی مانند Veo 2 ابراز نگرانی کرده و نگران هستند که این فناوریها ممکن است صنعتهای خلاق را بهطور کامل تحت تأثیر قرار دهند.
یک مطالعه که در سال 2024 به سفارش انجمن انیمیشن منتشر شده، برآورد کرده که بیش از 100,000 شغل در صنعت فیلم، تلویزیون و انیمیشن ایالات متحده تا سال 2026 تحت تأثیر هوش مصنوعی قرار خواهند گرفت.