مدلهای هوش مصنوعی پرهزینه گوگل به یک دستاورد بزرگ دست یافتهاند: موفقیت در بازی ویدیویی ۲۹ ساله. شب گذشته، ساندار پیچای، مدیر عامل گوگل، با انتشار پستی در شبکه اجتماعی X اعلام کرد: «چقدر پایان شگفتانگیز! Gemini 2.5 Pro به تازگی بازی Pokémon Blue را تمام کرد!»
ذکر این نکته حائز اهمیت است که پخش زنده Gemini Plays Pokémon توسط یک مهندس نرمافزار ۳۰ ساله با نام جوئل زد، بدون وابستگی به گوگل، انجام شده است. اما مدیران گوگل از این تلاش حمایت کردهاند. به عنوان مثال، لوگان کیلتپاتریک، رهبر محصول استودیو هوش مصنوعی گوگل، ماه گذشته نوشت که مدل Gemini «پیشرفتهای چشمگیری در به پایان رساندن بازی Pokémon» داشته و «پنجمین نشان خود را کسب کرده است» (در حالی که بهترین مدل دیگری که قبلاً معرفی شده، تنها ۳ نشان دارد). پیچای همچنین با شوخی گفت: «ما در حال کار بر روی API، هوش مصنوعی مصنوعی پوکمون هستیم :)»
اما چرا بازی پوکمون؟ در ماه فوریه، شرکت Anthropic پیشرفت مدلهای هوش مصنوعی Claude خود را در بازی «Pokémon Red» بررسی کرد و نوشت که «تفکر عمیق و آموزش عامل» به این مدل کمک بزرگی میکند تا در انجام وظایف غیرمنتظره مانند بازی این عنوان کلاسیک، موفقتر عمل کند. بازیهای «Pokémon Red» و «Blue» نسخههای متفاوتی از عنوان بازی گیمبوی هستند که نخستین بار در سال ۱۹۹۶ منتشر شد و به فرنچایز مشهور پوکمون مرتبط است. یک کانال Twitch نیز به نام Claude Plays Pokemon وجود دارد که جوئل زد آن را به عنوان یک منبع الهام معرفی کرده است.
با وجود رشد و پیشرفت مدل Claude، هنوز به نظر نمیرسد که این مدل توانسته باشد «Pokémon Red» را به پایان برساند. آیا این بدان معناست که Gemini بهطور عینی بهتر از این بازی است؟ در صفحه Twitch خود، جوئل زد از بینندگان خواسته تا «این را به عنوان یک معیار برای سنجش تواناییهای یک مدل زبان بزرگ در بازی پوکمون در نظر نگیرند. شما نمیتوانید مقایسههای مستقیم انجام دهید — Gemini و Claude ابزارهای متفاوتی دارند و اطلاعات متفاوتی دریافت میکنند.»
هر دو مدل هوش مصنوعی برای بازی کردن به کمک نیاز دارند و اینجا است که ابزارهای حمایتی به کار میآیند، که به این مدلها تصاویر بازی را همراه با اطلاعات اضافی ارائه میدهد، تا آنها بتوانند تصمیمگیری کنند (که ممکن است شامل تماس با عوامل متخصص باشد) و سپس دکمهای را که مطابق با دستور هوش مصنوعی است فشار دهند. جوئل زد اذعان کرد که مداخلات دیگری برای کمک به Gemini در اتمام بازی انجام شده، اما بر این باور است که این موضوع تقلب نیست. او گفت: «مداخلات من، تصمیمگیری و تواناییهای استدلال Gemini را به طور کلی بهبود میبخشد. من نشانههای خاصی ارائه نمیدهم — هیچ راهنمایی یا دستورالعمل مستقیمی برای چالشهای خاص مانند کوه ماه وجود ندارد. تنها چیزی که نزدیک است، این است که به Gemini بگویم باید برای به دست آوردن کلید آسانسور با یک عضو تیم راکت دو بار صحبت کند، که یک باگ بود و بعدها در Pokémon Yellow اصلاح شد.»
علاوه بر این، او خاطرنشان کرد که «Gemini Plays Pokémon هنوز در حال توسعه است و چارچوب آن به طور مداوم در حال تحول است.»