روند تصاویر هوش مصنوعی استودیو جیبلی قابلیت جدید GPT-4o اپن‌ای‌آی را با چالش مواجه می‌کند و ارائه نسخه رایگان را به تأخیر می‌اندازد

به‌روزرسانی جدید OpenAI: قابلیت ایجاد تصاویر انیمه‌ای با مدل GPT-4o

تکنولوژی‌های پیشرفته هوش مصنوعی هر روز تغییرات جدیدی را به کاربران ارائه می‌دهند و شرکت OpenAI نیز از این روند مستثنی نبوده است. این شرکت اخیراً نسخه جدید مدل GPT-4 به نام GPT-4o را معرفی کرده که قابلیت‌های بسیار پیشرفته‌ای برای ایجاد تصاویر دارد. این به‌روزرسانی، که تحت عنوان “ایجاد تصاویر بومی” معرفی شده، تجربه کاربران را در تعامل با هوش مصنوعی متحول می‌کند.

چگونه تصاویر معروف به سبک انیمه خلق می‌شوند؟

اگر در چند روز اخیر در شبکه‌های اجتماعی، به‌ویژه پلتفرم X (توییتر سابق) فعال بوده باشید، احتمالاً تصاویر رنگارنگ و سبک انیمه‌ای از عکس‌های معروف جهان را مشاهده کرده‌اید. این تصاویر در حالتی جذاب و شبیه به سبک انیمیشن‌های استودیو ژاپنی “استودیو گیبلی” به نمایش درآمده‌اند. انیمیشن‌های معروفی مانند «شاهزاده مونونوکه»، «همسایه من توتورو»، و «پسر و جرثقیل» از آثار برجسته این استودیو هستند که الهام‌بخش این آثار دیجیتال جدید بوده است.

این تصاویر شامل شخصیت‌های معروف تاریخی و فرهنگی همچون «ترامپ»، «مرد تانک» در اعتراضات میدان تیان‌آن‌من، «اسامه بن‌لادن»، و لحظات به‌یادماندنی دیگر از فرهنگ عامه مانند نقش معروف «سام راکول» در سریال «White Lotus» و حتی میم‌های محبوب گذشته می‌شود.

نحوه عملکرد مدل جدید GPT-4o

مدل جدید GPT-4o شرکت OpenAI انقلابی را در قابلیت‌های تولید تصویر ایجاد کرده است. پیش از این، هنگامی که کاربران با استفاده از ChatGPT درخواست ایجاد تصویر می‌دادند، این دستورها به مدل جداگانه DALL-E 3 ارجاع داده می‌شد. اما GPT-4o کاملاً مستقل عمل می‌کند و می‌تواند بر مبنای متن ورودی، بدون نیاز به اتصال به مدل خارجی، تصاویر ساخته و پرداخته کند.

ویژگی منحصربه‌فرد این مدل در استفاده از داده‌های چندرسانه‌ای است. OpenAI نه‌تنها متن و کد بلکه تصویر، ویدئو و صدا را نیز برای آموزش این مدل به کار گرفته است. این ویژگی کمک می‌کند که این مدل بتواند شباهت‌ها و تفاوت‌های میان انواع رسانه‌ها را درک کرده و مفاهیمی پیچیده را به شکلی خلاقانه تولید کند.

همچنین، کاربران می‌توانند با آپلود تصاویر موجود در دستگاه خود یا حتی اسکرین‌شات گرفته‌شده از وب، از قابلیت‌های این مدل استفاده کنند؛ به عنوان مثال، شما می‌توانید عکس خود و دوستانتان را در این مدل آپلود کرده و درخواست کنید که تمام افراد به سبک انیمیشن استودیو گیبلی طراحی شوند.

محدودیت‌ها و استقبال گسترده

با وجود استقبال گسترده از این قابلیت جدید، محدودیت‌هایی نیز وجود دارند. سام آلتمن، مدیرعامل OpenAI، اعلام کرده است که به دلیل تقاضای بسیار زیاد از سوی کاربران نسخه‌های اشتراکی Plus، Pro و Team، این ویژگی هنوز برای کاربران رایگان ارائه نشده و فعلاً با تأخیر مواجه خواهد بود.

چالش‌ها و واکنش‌ها

گرچه این قابلیت جدید توجه بسیاری را به خود جلب کرده، اما برخی از کاربران و حتی طرفداران انیمیشن کلاسیک واکنش‌های انتقادی نشان داده‌اند. هایائو میازاکی، خالق استودیو گیبلی، در مصاحبه‌ای قدیمی در سال 2016 به وضوح نارضایتی خود را از فناوری‌های مبتنی بر هوش مصنوعی در زمینه انیمیشن اعلام کرده بود. همچنین گمانه‌زنی‌ها نشان می‌دهند که داده‌های آموزش این مدل ممکن است شامل محتوای دارای حق نشر باشند که باعث نگرانی برخی کاربران شده است.

برای برندها و کسب‌وکارهایی که قصد استفاده از این فناوری را دارند، توصیه می‌شود ابتدا تأثیرات احتمالی این اقدام بر کاربران خود را بررسی کرده و با احتیاط وارد عمل شوند. اما برای کاربران طرفدار ابزارهای هوش مصنوعی، این قابلیت فرصتی بی‌نظیر برای خلق آثار هنری جذاب و متفاوت است.

نتیجه‌گیری

OpenAI بار دیگر نشان داد که در زمینه تولید محصولات مبتنی بر هوش مصنوعی، پیشرو است. این مدل نه تنها تصاویر متنوعی را ایجاد می‌کند، بلکه نقش مهمی در ارتقای شیوه‌های تعامل کاربران با رسانه‌های چندرسانه‌ای دارد. اگر به دنبال بهبود دانش خود در مورد کاربردهای پیشرفته هوش مصنوعی در صنایع مختلف هستید، اخبار و مقالات روزانه و هفتگی وب‌سایت بینا ویرا را دنبال کنید!

دستیار هوش مصنوعی

روند تصاویر هوش مصنوعی استودیو جیبلی قابلیت جدید GPT-4o اپن‌ای‌آی را با چالش مواجه می‌کند و ارائه نسخه رایگان را به تأخیر می‌اندازد

دیدگاه‌ خود را بنویسید لغو پاسخ