خبر جدید: تحقیقات Midjourney و دانشگاه نیویورک (NYU) به نوآوری در مدلهای زبانی هوش مصنوعی خلاقانه کمک میکند
شرکت Midjourney، که به عنوان یکی از پیشگامان تولید تصاویر هوش مصنوعی شناخته میشود، اخیراً گامهای بزرگی در گسترش فعالیتهای خود فراتر از حوزه تصویری برداشته است. این شرکت، که به گزارش منابع ردیاب شخصثالث نزدیک به ۲۰ میلیون کاربر در کانال دیسکورد خود دارد، در هفته جاری با همکاری تیمی از متخصصان یادگیری ماشین دانشگاه نیویورک (NYU)، یک مقاله تحقیقاتی جدید منتشر کرده است. این تحقیقات بر آموزش مدلهای زبانی بزرگ (LLMs) مانند مدلهای متنباز Llama از Meta و Mistral برای ارائه محتوای خلاقانه تمرکز دارد.
تکنیکهای جدید برای تولید متنهای متنوعتر و جذابتر
در مقالهای که بر روی پلتفرم کد هوش مصنوعی Hugging Face منتشر شده است، دو تکنیک پیشرفته معرفی شد: بهینهسازی ترجیح مستقیم متنوع (DDPO) و بهینهسازی نسبت احتمال ترجیح متنوع (DORPO). این روشها با هدف افزایش دامنه خروجیهای ممکن از مدلهای زبانی، در عین حفظ انسجام و خوانایی، توسعه داده شدهاند.
Midjourney، که بیشتر به خاطر مدلهای دیفیوژن تولیدکننده تصویر مشهور است، اینبار به فکر بازتعریف خلاقیت در مدلهای زبانی افتاده است. این حرکت نشان میدهد که دیدگاه این شرکت تنها به حوزه تصویری محدود نبوده و پتانسیل متنهای تولید شده توسط هوش مصنوعی هنوز قابل گسترش است.
همکاری میان فناوری و خلاقیت
در حوزههایی مانند نگارش داستان یا تولید محتوا، خروجیهای مدلهای زبانی معمولاً به یک الگوی تکراری و محدود ختم میشوند. این موضوع باعث کاهش جذابیت و تنوع تولیدات هوش مصنوعی شده است. محققان Midjourney و NYU برای حل این چالش از مفهوم انحراف استفاده کردند؛ معیاری که نشاندهنده تفاوت و تنوع پاسخها نسبت به یکدیگر است. با این تکنیکها، مدلهای زبانی توانایی تولید پاسخهای خلاقانهتر و غیر قابل پیشبینی را پیدا میکنند.
برای مثال، در پاسخ به یک درخواست مانند “داستانی درباره یک سگ در ماه بنویسید”، مدلهای آموزشی اغلب به داستانهایی مشابه گرایش دارند. اما با استفاده از DDPO و DORPO، مدل قادر خواهد بود مسیرهای جدید و متفاوتی برای روایت این داستان ایجاد کند.
کاربردهای عملی برای سازمانها و تیمهای فناوری
این یافتهها برای تیمهای فعال در زمینه توسعه و استقرار مدلهای هوش مصنوعی در سازمانها اهمیت فراوانی دارد. از کاربردهای عملی تحقیق Midjourney و NYU میتوان به موارد زیر اشاره کرد:
– تولید محتوای خلاقانه برای بازاریابی یا نگارش داستان.
– افزایش جذابیت خروجیهای متنی در ابزارهای هوش مصنوعی سازمانی.
– بهبود عملکرد مدلها در تولید کدهای متنوع و دقیق برای برنامهنویسی.
علاوه بر این، این تحقیق فرصتهای جدیدی برای توسعه مدلهای زبانبنیان فراهم کرده است. تیمهای فنی میتوانند با اعمال این تکنیکها خروجیهای نرمافزاری خود را از حالت کلیشهای خارج کنند و به خلاقیت بیشتری دست یابند.
کدهای تحقیقاتی برای علاقهمندان در دسترس خواهد بود
در راستای مشارکت علمی، محققان این پروژه اعلام کردهاند که کدهای توسعه یافته برای تکنیکهای DDPO و DORPO به زودی از طریق مخزن عمومی گیتهاب منتشر خواهند شد. این اقدام به سازمانها و توسعهدهندگان مستقل امکان استفاده عملی از این پژوهش و تطبیق آن با نیازهای خاص خود را میدهد.
نتیجهگیری
تحقیقات Midjourney و NYU نشان دادهاند که میتوان مدلهای زبانی را به گونهای آموزش داد که توانایی ایجاد محتواهای خلاقانه و جذاب داشته باشند. این پیشرفتها نشان میدهد که هنوز پتانسیل فراوانی برای بهبود عملکرد مدلهای متنی وجود دارد، و این تنها آغاز سفری است که صنعت هوش مصنوعی را وارد عصر جدیدی از خلاقیتهای دیجیتال خواهد کرد.
برای دریافت آخرین اخبار و بهروزرسانیها پیرامون هوش مصنوعی و دستاوردهای Midjourney، با خبرنامههای روزانه و هفتگی ما همراه باشید.