آزمایشگاه Thinking Machines به سرپرستی میرا موراتی (Mira Murati)، مدیر فناوری پیشین OpenAI، در تازه‌ترین اقدام تحقیقاتی خود به موضوعی پرداخته که برای توسعه‌دهندگان و پژوهشگران هوش مصنوعی اهمیت بالایی دارد: چگونگی تولید پاسخ‌های قابل بازتولید در مدل‌های زبان بزرگ (LLM). این تیم که با سرمایه اولیه ۲ میلیارد دلار و حضور جمعی از پژوهشگران سابق OpenAI توجه بسیاری را جلب کرده، در اولین پست از بلاگ تحقیقاتی جدید خود، Connectionism، گزارشی با عنوان «Defeating Nondeterminism in LLM Inference» منتشر کرده است.

در این مقاله پژوهشی، هوراس هِی (Horace He) از دلایل اصلی ایجاد عدم قطعیت در پاسخ‌های مدل‌های زبانی سخن گفته است. به‌صورت خلاصه، او علت اصلی را نحوه «ترکیب» یا ارکستراسیون کرنل‌های GPU — برنامه‌های کوچک اجراشونده در تراشه‌های گرافیکی مانند محصولات انویدیا — در فرآیند استنتاج مدل می‌داند. به عبارت دیگر، اجرای موازی، چیدمان کرنل‌ها و جزئیات محاسباتی در سطح سخت‌افزار می‌تواند تغییرات ریز در محاسبات عددی ایجاد کند که در خروجی نهایی مدل به‌شکل پاسخ‌های متفاوت ظاهر می‌شود.

چرا این موضوع مهم است؟
– قابلیت بازتولید پاسخ‌ها: برای پژوهش علمی، عیب‌یابی مدل‌ها و اعتمادپذیری خدمات مبتنی بر AI، داشتن نتایج قابل بازتولید ضروری است.
– بهبود آموزش تقویتی (Reinforcement Learning): در فرایند RL، اگر پاسخ‌های مدل‌ها ناپایدار باشند، سیگنال پاداش نویزی می‌شود و آموزش دشوارتر می‌گردد. هِی می‌گوید که کنترل لایه ارکستراسیون می‌تواند روند RL را هموارتر کند.
– کاربردهای سازمانی: شرکت‌ها برای سفارشی‌سازی مدل‌ها و فراهم کردن خروجی‌های قابل اتکا به راه‌حل‌هایی نیاز دارند که رفتار مدل را پیش‌بینی‌پذیرتر سازند.

Thinking Machines Lab اعلام کرده که قصد دارد یافته‌ها، کدها و مطالب تحقیقاتی خود را به‌طور مکرر منتشر کند تا علاوه بر منافع عمومی، فرهنگ پژوهشی داخلی خود را نیز تقویت کند. این تعهد به اشتراک‌گذاری پژوهش در تضاد با روند بسته‌تر شدن برخی رقبای بزرگ است که با رشد سازمانی، بخش‌هایی از تحقیقاتشان را کمتر منتشر می‌کنند.

نکته مهم این است که انتشار این پست، هرچند چشم‌انداز روشنی از فناوری نهایی ارائه نمی‌دهد، نمایی از جهت‌گیری پژوهشی این استارتاپ را نشان می‌دهد: پرداختن به مسائل بنیادین در مرزهای تحقیق در هوش مصنوعی. آزمون واقعی اما اجرای این راهکارها در محصولات کاربردی و توجیه ارزش‌گذاری ۱۲ میلیارد دلاری اعلام‌شده برای شرکت خواهد بود.

پست Connectionism و مقاله «Defeating Nondeterminism in LLM Inference» فرصتی نادر برای مشاهده درون‌مایهٔ فنی یکی از محرمانه‌ترین تیم‌های سیلیکون‌ولی فراهم کرده است؛ پیگیری انتشارهای آتی این آزمایشگاه می‌تواند برای پژوهشگران، استارتاپ‌ها و سازمان‌هایی که به دنبال مدل‌های زبان قابل اعتمادتر هستند، اطلاعات ارزشمندی داشته باشد.

ایجاد متن‌های دقیق از فایل‌های صوتی شما

دیدگاه‌ خود را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

اسکرول به بالا