کمیته رکن چهارم – گزارشی جدید از مؤسسه پژوهشی غیرانتفاعی Epoch AI هشدار میدهد که روند پیشرفت مدلهای هوش مصنوعی استدلالمحور ممکن است در آیندهای نزدیک با کاهش سرعت مواجه شود. این مدلها که با هدف حل مسائل پیچیده در حوزههایی مانند ریاضی و برنامهنویسی طراحی شدهاند، در ماههای اخیر رشد چشمگیری داشتهاند، اما اکنون تحلیلها از نزدیک شدن آنها به سقف توان فنی و تحقیقاتی خبر میدهند.

به گزارش کمیته رکن چهارم، مدلهایی مانند o3 از شرکت OpenAI، پس از مرحله آموزش اولیه، با بهرهگیری از روش یادگیری تقویتی بهینه میشوند. در این روش، مدل با دریافت بازخورد در مسیر حل مسائل پیچیده بهبود مییابد. با این حال، مؤسسه Epoch اشاره کرده است که تاکنون منابع پردازشی قابلتوجهی در این مرحله به کار گرفته نشده بود، ولی اکنون این روند در حال تغییر است.
شرکت OpenAI اعلام کرده که برای آموزش مدل o3، نسبت به نسخه قبلی خود یعنی o1، از ۱۰ برابر توان پردازشی بیشتر استفاده کرده است. همچنین یکی از محققان این شرکت فاش کرده که تمرکز آتی بر استفاده گستردهتر از یادگیری تقویتی خواهد بود — حتی بیش از مرحله آموزش اولیه مدل.
جاش یو، تحلیلگر مؤسسه Epoch، در گزارش خود نوشته است که عملکرد مدلهای استدلالی که با یادگیری تقویتی بهبود یافتهاند، در حال حاضر با سرعتی بسیار بالاتر از مدلهای معمولی رشد میکند، اما احتمالاً این روند تا سال ۲۰۲۶ به سقف فعلی خواهد رسید. وی هشدار داده که اگر هزینههای تحقیقاتی همچنان بالا باقی بمانند، ممکن است توسعه این مدلها محدودتر از پیشبینیها باشد.
این تحلیل در حالی منتشر شده که صنعت هوش مصنوعی سرمایهگذاریهای گستردهای در مدلهای پیشرفته انجام داده و کند شدن روند پیشرفت در این حوزه میتواند نگرانیهایی برای شرکتهای فعال ایجاد کند. مطالعات پیشین نیز نشان دادهاند که مدلهای استدلالی با وجود عملکرد قویتر، نرخ بالاتری از خطاهای محتوایی (Hallucination) نسبت به مدلهای سنتی دارند.
