عنوان: تحولات جدید در هوش مصنوعی: نبرد گوگل و آنتروپیک در دنیای پیکمون
در دنیای رقابتی هوش مصنوعی، شرکتهای بزرگ مانند گوگل و آنتروپیک به تازگی به پیشرفتهای جالبی دست یافتهاند که میتواند الهامبخش آینده این صنعت باشد. با توجه به گزارش اخیر، مدل هوش مصنوعی جدید گوگل به نام Gemini 2.5 Pro در حین بازی پیکمون با چالشهای قابل توجهی روبرو شده است. بررسیهای انجامشده نشان میدهد که این مدل در شرایط بحرانی و نزدیک به شکست، دچار «پانیک» میشود که منجر به افت کیفیت در عملکرد و توانایی Reasoning آن میگردد.
در سالهای اخیر، مقایسه عملکرد مدلهای مختلف هوش مصنوعی، به یک هنر پیچیده تبدیل شده که اغلب بدون زمینهسازی مناسب انجام میشود. با این حال، برخی محققان بر این اعتقادند که بررسی نحوه بازی هوش مصنوعیها در بازیهای ویدئویی میتواند به درک بهتر تواناییهای آنها کمک کند. بهعنوان مثال، دو توسعهدهنده مستقل، استریمهای زندهای به نامهای «Gemini Plays Pokémon» و «Claude Plays Pokémon» راهاندازی کردهاند که در آنها هوش مصنوعی در حال گذراندن بازیهای ویدئویی کلاسیک پیکمون به نمایش گذاشته میشود. این استریمها فرآیند Reasoning هوش مصنوعی را به صورت زنده نشان میدهند و بینندگان میتوانند نحوه مواجهه این مدلها با چالشهای بازی را مشاهده کنند.
گرچه پیشرفتهای مدلهای هوش مصنوعی چشمگیر است، اما آنها هنوز در بازیهای پیکمون عملکرد مناسبی از خود نشان نمیدهند. مدل Gemini برای پردازش و تحلیل یک مرحله بازی که یک کودک میتواند در زمان بسیار کمتری به پایان برساند، به ساعات زیادی نیاز دارد. آنچه تماشای عملکرد این AI را جالب میسازد، بیشتر رفتار آن در حین بازی است تا زمان تکمیل بازی.
طبق گزارشها، در طول بازی، Gemini 2.5 Pro به موقعیتهای مختلفی برخورد میکند که موجب شبیهسازی «پانیک» میشود و این واکنش میتواند منجر به کاهش عملکرد آن گردد. همچنین، مشخص شده که Claude نیز در مسیریابی خود در دنیای پیکمون رفتارهای عجیبی از خود نشان داده است. بهطور مثال، این AI به اشتباه تصور کرد که اگر همه پیکمونهایش از بین بروند، به مرکز پیکمون در شهر بعدی منتقل میشود.
اگرچه این مدلها هنوز نمیتوانند به خوبی انسانها بازی کنند، اما در مواردی توانستهاند به حل معماها با دقت بالا دست یابند. با همکاری برخی انسانها، Gemini 2.5 Pro ابزارهای کارآمدی برای حل معماهای سنگ و یافتن مسیرهای مؤثر برای رسیدن به مقاصد ایجاد کرده است.
گوگل بر این باور است که شاید این مدل به زودی قادر به ایجاد این ابزارها بدون نیاز به کمک انسان باشد. آیا ممکن است Gemini در آینده، به طریقی به «مدول عدم ترس» دست یابد؟ پاسخ به این پرسش هنوز در پرده ابهام است.
در مجموع، به نظر میرسد که بررسی رفتارهای این مدلهای هوش مصنوعی نه تنها درک عمیقتری از عملکرد آنها به ما ارائه میدهد، بلکه میتواند زمینه ساز نوآوریهای جدید در این حوزه باشد.