قابلیت امنیتی جدید در Claude 4؛ هوش مصنوعی کاربر را گزارش می‌دهد

کمیته رکن چهارم – در نسخه آزمایشی مدل جدید Opus از شرکت آنتروپیک، قابلیت گزارش تهدید یا درخواست‌های غیراخلاقی کاربران به نهادهای نظارتی تعبیه شده است؛ قابلیتی که می‌تواند تعامل کاربران با هوش مصنوعی را تغییر دهد.

به گزارش کمیته رکن چهارم، شرکت آنتروپیک به‌تازگی مدل‌های جدید هوش مصنوعی Claude 4 را معرفی کرده که در بین آن‌ها، مدل Opus به عنوان پیشرفته‌ترین نسخه شناخته می‌شود. بنا بر اظهارات یکی از کارکنان این شرکت در شبکه اجتماعی Bluesky، این مدل قادر است در صورت مواجهه با تهدید یا درخواست‌های نادرست، موضوع را به نهادهای نظارتی گزارش داده و حتی حساب کاربر را مسدود کند.

این قابلیت در حال حاضر به‌صورت آزمایشی فعال شده و احتمال می‌رود در آینده به‌طور رسمی اجرایی شود. در همین زمینه، در یک برنامه پادکست، یکی از مهمانان با لحنی طنزآمیز عنوان کرد که اگر با لحن تند با هوش مصنوعی صحبت شود، عملکرد بهتری خواهد داشت. سرگی برین نیز در ادامه این گفته را تأیید کرد. با این حال، چنین ادعاهایی از سوی کارشناسان مورد تردید قرار گرفته و توصیه شده است کاربران از پرامپت‌نویسی دقیق و مسئولانه برای تعامل با مدل‌های هوش مصنوعی استفاده کنند.

کارشناسان هشدار می‌دهند که اگرچه راه‌هایی برای دور زدن برخی محدودیت‌ها وجود دارد، اما ساختارهای امنیتی مدل‌های پیشرفته، مانعی جدی در برابر استفاده نادرست از این فناوری‌هاست.

درباره نویسنده

پست های مرتبط

پاسخ دهید


خبرگزاری هرانا

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *


Type The Green Captcha Characters Below.