شگفتی میدجِرنی: پژوهش جدید در افزایش خلاقیت مدل‌های زبانی بزرگ

خبر جدید: تحقیقات Midjourney و دانشگاه نیویورک (NYU) به نوآوری در مدل‌های زبانی هوش مصنوعی خلاقانه کمک می‌کند

شرکت Midjourney، که به عنوان یکی از پیشگامان تولید تصاویر هوش مصنوعی شناخته می‌شود، اخیراً گام‌های بزرگی در گسترش فعالیت‌های خود فراتر از حوزه تصویری برداشته است. این شرکت، که به گزارش منابع ردیاب شخص‌ثالث نزدیک به ۲۰ میلیون کاربر در کانال دیسکورد خود دارد، در هفته جاری با همکاری تیمی از متخصصان یادگیری ماشین دانشگاه نیویورک (NYU)، یک مقاله تحقیقاتی جدید منتشر کرده است. این تحقیقات بر آموزش مدل‌های زبانی بزرگ (LLMs) مانند مدل‌های متن‌باز Llama از Meta و Mistral برای ارائه محتوای خلاقانه تمرکز دارد.

تکنیک‌های جدید برای تولید متن‌های متنوع‌تر و جذاب‌تر

در مقاله‌ای که بر روی پلتفرم کد هوش مصنوعی Hugging Face منتشر شده است، دو تکنیک پیشرفته معرفی شد: بهینه‌سازی ترجیح مستقیم متنوع (DDPO) و بهینه‌سازی نسبت احتمال ترجیح متنوع (DORPO). این روش‌ها با هدف افزایش دامنه خروجی‌های ممکن از مدل‌های زبانی، در عین حفظ انسجام و خوانایی، توسعه داده شده‌اند.

Midjourney، که بیشتر به خاطر مدل‌های دیفیوژن تولید‌کننده تصویر مشهور است، این‌بار به فکر بازتعریف خلاقیت در مدل‌های زبانی افتاده است. این حرکت نشان می‌دهد که دیدگاه این شرکت تنها به حوزه تصویری محدود نبوده و پتانسیل متن‌های تولید شده توسط هوش مصنوعی هنوز قابل گسترش است.

همکاری میان فناوری و خلاقیت

در حوزه‌هایی مانند نگارش داستان یا تولید محتوا، خروجی‌های مدل‌های زبانی معمولاً به یک الگوی تکراری و محدود ختم می‌شوند. این موضوع باعث کاهش جذابیت و تنوع تولیدات هوش مصنوعی شده است. محققان Midjourney و NYU برای حل این چالش از مفهوم انحراف استفاده کردند؛ معیاری که نشان‌دهنده تفاوت و تنوع پاسخ‌ها نسبت به یکدیگر است. با این تکنیک‌ها، مدل‌های زبانی توانایی تولید پاسخ‌های خلاقانه‌تر و غیر قابل پیش‌بینی را پیدا می‌کنند.

برای مثال، در پاسخ به یک درخواست مانند “داستانی درباره یک سگ در ماه بنویسید”، مدل‌های آموزشی اغلب به داستان‌هایی مشابه گرایش دارند. اما با استفاده از DDPO و DORPO، مدل قادر خواهد بود مسیرهای جدید و متفاوتی برای روایت این داستان ایجاد کند.

کاربردهای عملی برای سازمان‌ها و تیم‌های فناوری

این یافته‌ها برای تیم‌های فعال در زمینه توسعه و استقرار مدل‌های هوش مصنوعی در سازمان‌ها اهمیت فراوانی دارد. از کاربردهای عملی تحقیق Midjourney و NYU می‌توان به موارد زیر اشاره کرد:
– تولید محتوای خلاقانه برای بازاریابی یا نگارش داستان.
– افزایش جذابیت خروجی‌های متنی در ابزارهای هوش مصنوعی سازمانی.
– بهبود عملکرد مدل‌ها در تولید کدهای متنوع و دقیق برای برنامه‌نویسی.

علاوه بر این، این تحقیق فرصت‌های جدیدی برای توسعه مدل‌های زبان‌بنیان فراهم کرده است. تیم‌های فنی می‌توانند با اعمال این تکنیک‌ها خروجی‌های نرم‌افزاری خود را از حالت کلیشه‌ای خارج کنند و به خلاقیت بیشتری دست یابند.

کدهای تحقیقاتی برای علاقه‌مندان در دسترس خواهد بود

در راستای مشارکت علمی، محققان این پروژه اعلام کرده‌اند که کدهای توسعه یافته برای تکنیک‌های DDPO و DORPO به زودی از طریق مخزن عمومی گیت‌هاب منتشر خواهند شد. این اقدام به سازمان‌ها و توسعه‌دهندگان مستقل امکان استفاده عملی از این پژوهش و تطبیق آن با نیازهای خاص خود را می‌دهد.

نتیجه‌گیری

تحقیقات Midjourney و NYU نشان داده‌اند که می‌توان مدل‌های زبانی را به گونه‌ای آموزش داد که توانایی ایجاد محتواهای خلاقانه و جذاب داشته باشند. این پیشرفت‌ها نشان می‌دهد که هنوز پتانسیل فراوانی برای بهبود عملکرد مدل‌های متنی وجود دارد، و این تنها آغاز سفری است که صنعت هوش مصنوعی را وارد عصر جدیدی از خلاقیت‌های دیجیتال خواهد کرد.

برای دریافت آخرین اخبار و به‌روز‌رسانی‌ها پیرامون هوش مصنوعی و دستاوردهای Midjourney، با خبرنامه‌های روزانه و هفتگی ما همراه باشید.

دستیار هوش مصنوعی