کمیته رکن چهارم – گزارش جدیدی از گوگل دیپمایند نشان میدهد که مدل هوش مصنوعی Gemini 2.5 Pro هنگام بازی در نسخه قدیمی بازی پوکمون، در موقعیتهایی خاص دچار «وحشت» میشود و توانایی استدلال آن کاهش مییابد. این بررسی که در تاریخ ۱۷ ژوئن ۲۰۲۵ میلادی منتشر شده، نگاهی متفاوت و سرگرمکننده به رفتار مدلهای هوش مصنوعی در موقعیتهای شبیهسازیشده دارد.

به گزارش کمیته رکن چهارم، این بررسی بخشی از رقابت میان شرکتهای هوش مصنوعی برای ارزیابی عملکرد مدلها در سناریوهای متفاوت است. در استریمهایی با عناوین «Gemini بازی میکند: پوکمون» و «Claude بازی میکند: پوکمون» در توییچ، کاربران شاهد تلاش این مدلها برای عبور از مراحل بازی هستند.
رفتار مدلها در جریان بازی قابل توجه است؛ Gemini هنگام مواجهه با خطر شکست، بهگونهای عمل میکند که به رفتار انسانی تحت فشار شباهت دارد. این حالت منجر به اشتباهات تکراری، نادیدهگرفتن ابزارها و تصمیمگیریهای عجولانه میشود.
مدل Claude نیز رفتار عجیبی داشته، بهویژه زمانیکه در غار Mt. Moon گیر کرد و با یک تصمیم اشتباه، همه پوکمونهایش را قربانی کرد تا به مرکز درمانی بعدی برود؛ در حالیکه بازی او را به آخرین مکان بازمیگرداند.
با وجود این نقصها، مدل Gemini در حل معماها عملکرد درخشانی نشان داده است. برای مثال، با یک دستور ساده درباره فیزیک سنگ، توانست مسیرهای پیچیده Victory Road را تحلیل و در اولین تلاش حل کند.
گزارش گوگل حاکی از آن است که مدل توانایی توسعه ابزارهای کمکی را نیز دارد و شاید روزی بتواند ماژولی با عنوان «وحشت نکن» برای خودش بسازد.
