استرس بازی، عملکرد Gemini را مختل کرد

خرداد ۲۸, ۱۴۰۴ نوشتهٔ nastaran بدون نظر

کمیته رکن چهارم – گزارش جدیدی از گوگل دیپ‌مایند نشان می‌دهد که مدل هوش مصنوعی Gemini 2.5 Pro هنگام بازی در نسخه قدیمی بازی پوکمون، در موقعیت‌هایی خاص دچار «وحشت» می‌شود و توانایی استدلال آن کاهش می‌یابد. این بررسی که در تاریخ ۱۷ ژوئن ۲۰۲۵ میلادی منتشر شده، نگاهی متفاوت و سرگرم‌کننده به رفتار مدل‌های هوش مصنوعی در موقعیت‌های شبیه‌سازی‌شده دارد.

به گزارش کمیته رکن چهارم، این بررسی بخشی از رقابت میان شرکت‌های هوش مصنوعی برای ارزیابی عملکرد مدل‌ها در سناریوهای متفاوت است. در استریم‌هایی با عناوین «Gemini بازی می‌کند: پوکمون» و «Claude بازی می‌کند: پوکمون» در توییچ، کاربران شاهد تلاش این مدل‌ها برای عبور از مراحل بازی هستند.

رفتار مدل‌ها در جریان بازی قابل توجه است؛ Gemini هنگام مواجهه با خطر شکست، به‌گونه‌ای عمل می‌کند که به رفتار انسانی تحت فشار شباهت دارد. این حالت منجر به اشتباهات تکراری، نادیده‌گرفتن ابزارها و تصمیم‌گیری‌های عجولانه می‌شود.

مدل Claude نیز رفتار عجیبی داشته، به‌ویژه زمانی‌که در غار Mt. Moon گیر کرد و با یک تصمیم اشتباه، همه پوکمون‌هایش را قربانی کرد تا به مرکز درمانی بعدی برود؛ در حالی‌که بازی او را به آخرین مکان بازمی‌گرداند.

با وجود این نقص‌ها، مدل Gemini در حل معماها عملکرد درخشانی نشان داده است. برای مثال، با یک دستور ساده درباره فیزیک سنگ، توانست مسیرهای پیچیده Victory Road را تحلیل و در اولین تلاش حل کند.

گزارش گوگل حاکی از آن است که مدل توانایی توسعه ابزارهای کمکی را نیز دارد و شاید روزی بتواند ماژولی با عنوان «وحشت نکن» برای خودش بسازد.

مطالب مرتبط

بسته جعلی NuGet برای دست‌کاری نتایج بازی Digitain شناسایی شد

OpenAI نقش مدل‌های خود در حمله به Hugging Face را تأیید کرد

آسیب‌پذیری Kiro اجرای کد مخرب را بدون تأیید کاربر ممکن می‌کرد

دیدگاه خود را بنویسید لغو پاسخ