به تازگی، تیم تحقیقاتی هوش مصنوعی اپل موفق به توسعه یک سیستم نوآورانه شده است که قادر به تولید تصاویر با وضوح بالا است و میتواند به رقابت با مدلهای دیفیوزن که فناوری اصلی تولیدکنندگان تصویری همچون DALL-E و Midjourney به شمار میروند، بپردازد. این پیشرفت در مقالهای تحقیقاتی که هفته گذشته منتشر شد، تحت عنوان “STARFlow” معرفی شده است. این سیستم با همکاری محققان اپل و شرکای دانشگاهی طراحی شده و ترکیبی از جریانهای نرمالیزه و ترنسفورمرهای خوداتورگرسیو را برای دستیابی به عملکرد رقابتی در مقایسه با مدلهای دیفیوزن پیشرفته به کار میبرد.
این دستاورد در زمان حساسی برای اپل به وقوع پیوسته است، چرا که این شرکت با انتقادات فزایندهای در زمینه هوش مصنوعی مواجه است. در کنفرانس توسعهدهندگان جهانی این هفته، اپل فقط به ارائه بهروزرسانیهای محدود در پلتفرم هوش مصنوعی خود پرداخت و فشار رقابتی را بر شرکت نمایان کرد.
تحقیقات تیم شامل محققانی از اپل و دانشگاههای معتبر همچون دانشگاه کالیفرنیا، برکلی و دانشگاه جورجیا تک است. آنها اعلام کردند که این تحقیق نشاندهنده نخستین موفقیت در نمایش کارایی جریانهای نرمالیزه در مقیاس و وضوح بالا است. هدف این تحقیق، توسعه قابلیتهای منحصربهفرد هوش مصنوعی است که میتواند محصولات اپل را از رقبا متمایز کند.
در راستای حل چالشهای اساسی در نسلسازی تصاویر هوش مصنوعی، این تیم بر روی تقویت جریانهای نرمالیزه کار کرده است. جریانهای نرمالیزه، که نوعی مدل تولیدی هستند، به طور سنتی در حاشیه مدلهای دیفیوزن و شبکههای مولد متعارض قرار داشتهاند. STARFlow به عملکردی رقابتی در تولید تصاویر شرطی بر اساس کلاس و متن دست یافته و کیفیت نمونههای آن نزدیک به مدلهای دیفیوزن پیشرفته است.
افزودن نوآوریهای کلیدی به سیستم، به ویژه طراحی عمیق-سطحی و کار در فضای نهان خودرمزگذاریشده، به افزایش کارایی و دقت مدل کمک کرده است. برخلاف مدلهای دیفیوزن که به فرآیندهای تکراری وابسته هستند، STARFlow از خواص ریاضیاتی جریانهای نرمالیزه استفاده میکند.
در حالی که اپل با فشار رو به رشد برای نشان دادن پیشرفتهای معنیدار در هوش مصنوعی مواجه است، این تحقیق میتواند در کاربردهایی که نیاز به کنترل دقیق بر محتوای تولیدی دارند، مزیتهای جدیدی را ارائه دهد. این پژوهش نشاندهنده استراتژی اپل در همکاری با دانشگاههای برجسته برای ارتقاء قابلیتهای هوش مصنوعی خود است.
مقاله تحقیقاتی کامل این پروژه در arXiv در دسترس است و میتواند نقاط شروعی برای پژوهشگران و مهندسانی باشد که به دنبال گسترش این دستاوردها در حوزه هوش مصنوعی تولیدی هستند. سوال اصلی اکنون این است که آیا اپل میتواند این دستاوردهای تحقیقاتی را به ویژگیهای هوش مصنوعی مصرفی تبدیل کند که مشابه رقبایش به محبوبیت برسد.