انتشار مدل پیشرفته Gemini 2.5 Deep Think توسط Google DeepMind
گوگل دیپمایند از راهاندازی مدل هوش مصنوعی پیشرفته Gemini 2.5 Deep Think خبر داد. این مدل به عنوان یکی از برترین مدلهای استدلالی هوش مصنوعی این شرکت شناخته میشود و قادر است با بررسی و ارزیابی همزمان چندین ایده، به سوالات پاسخ دهد و بهترین جواب را انتخاب کند. کاربران اشتراکی با عنوان “Ultrasubscription” که ماهیانه ۲۵۰ دلار پرداخت میکنند، از روز جمعه به این مدل در اپلیکیشن Gemini دسترسی خواهند داشت.
مدل Gemini 2.5 Deep Think برای اولین بار در ماه مه ۲۰۲۵ در کنفرانس Google I/O رونمایی شد و به عنوان نخستین مدل چندعامل عمومی گوگل معرفی گردید. این سیستمها برای حل سوالات، از چندین عامل هوش مصنوعی به صورت موازی استفاده میکنند. این روش نیاز به منابع محاسباتی بیشتری دارد اما به طور کلی نتایج بهتری را به همراه دارد. گوگل از یک نسخه اصلاحشده از این مدل برای کسب مدال طلا در المپیاد بینالمللی ریاضی (IMO) امسال استفاده کرد.
علاوه بر Gemini 2.5 Deep Think، این شرکت مدل مورد استفاده خود در IMO را نیز به گروهی از ریاضیدانان و دانشگاهیان ارائه خواهد کرد. گوگل اشاره میکند که این مدل هوش مصنوعی “ساعات طولانی” برای پردازش استدلال نیاز دارد، در حالی که بیشتر مدلهای موجود برای مصرفکننده تنها چند ثانیه یا دقیقه زمان میبرند. این شرکت امیدوار است مدل IMO به تحقیقات علمی کمک کند و به دنبال نظرات برای بهبود سیستم چندعاملی برای استفادههای دانشگاهی است.
مدل Gemini 2.5 Deep Think بهبود قابل توجهی را نسبت به نسخههای پیشین نشان میدهد. گوگل همچنین از توسعه “تکنیکهای نوین یادگیری تقویتی” خبر داده که باعث میشود این مدل به بهترین نحو از مسیرهای استدلال خود استفاده کند. به گفته گوگل، “Deep Think میتواند به افراد در حل مسائلی که نیاز به خلاقیت، برنامهریزی استراتژیک و بهبود گام به گام دارند، کمک کند.”
این مدل در آزمون Humanity’s Last Exam (HLE) که توانایی AI را در پاسخگویی به هزاران سوال منابع جمعآوری شده در زمینههای ریاضیات، علوم انسانی و علوم طبیعی ارزیابی میکند، عملکردی بینظیر داشته است. گوگل ادعا میکند که مدل Gemini 2.5 Deep Think موفق به کسب امتیاز ۳۴.۸٪ در HLE (بدون ابزار) شده که به مراتب بالاتر از مدلهای xAI و OpenAI است.
علاوه بر این، مدل Gemini 2.5 Deep Think به طور خودکار با ابزارهایی مانند اجرای کد و جستجوی گوگل کار میکند و به گفته گوگل، این مدل میتواند پاسخهایی به مراتب طولانیتر نسبت به مدلهای سنتی تولید کند. در آزمایشهای گوگل، این مدل وظایف توسعه وبای زیبا و دقیقتری را نسبت به دیگر مدلها به وجود آورد.
به نظر میرسد که چندین آزمایشگاه پیشرو در حوزه هوش مصنوعی بر روی رویکرد چندعاملی متمرکز شدهاند. شرکت xAI به رهبری ایلان ماسک همچنین سیستم چندعاملی خود را با نام Grok 4 Heavy منتشر کرده که به ادعای آنها، عملکرد بینظیری در چندین معیار دارد. گوگل اعلام کرده است که به زودی دسترسی به مدل Gemini 2.5 Deep Think را به یک گروه خاص از آزمایشکنندگان از طریق Gemini API ارائه خواهد داد تا بتواند روشهای استفاده توسعهدهندگان و شرکتها از این سیستم چندعاملی را بهتر بررسی کند.
