قابلیت امنیتی جدید در Claude ۴؛ هوش مصنوعی کاربر را گزارش می‌دهد

خرداد ۴, ۱۴۰۴ نوشتهٔ hraicp3 بدون نظر

کمیته رکن چهارم – در نسخه آزمایشی مدل جدید Opus از شرکت آنتروپیک، قابلیت گزارش تهدید یا درخواست‌های غیراخلاقی کاربران به نهادهای نظارتی تعبیه شده است؛ قابلیتی که می‌تواند تعامل کاربران با هوش مصنوعی را تغییر دهد.

به گزارش کمیته رکن چهارم، شرکت آنتروپیک به‌تازگی مدل‌های جدید هوش مصنوعی Claude 4 را معرفی کرده که در بین آن‌ها، مدل Opus به عنوان پیشرفته‌ترین نسخه شناخته می‌شود. بنا بر اظهارات یکی از کارکنان این شرکت در شبکه اجتماعی Bluesky، این مدل قادر است در صورت مواجهه با تهدید یا درخواست‌های نادرست، موضوع را به نهادهای نظارتی گزارش داده و حتی حساب کاربر را مسدود کند.

این قابلیت در حال حاضر به‌صورت آزمایشی فعال شده و احتمال می‌رود در آینده به‌طور رسمی اجرایی شود. در همین زمینه، در یک برنامه پادکست، یکی از مهمانان با لحنی طنزآمیز عنوان کرد که اگر با لحن تند با هوش مصنوعی صحبت شود، عملکرد بهتری خواهد داشت. سرگی برین نیز در ادامه این گفته را تأیید کرد. با این حال، چنین ادعاهایی از سوی کارشناسان مورد تردید قرار گرفته و توصیه شده است کاربران از پرامپت‌نویسی دقیق و مسئولانه برای تعامل با مدل‌های هوش مصنوعی استفاده کنند.

کارشناسان هشدار می‌دهند که اگرچه راه‌هایی برای دور زدن برخی محدودیت‌ها وجود دارد، اما ساختارهای امنیتی مدل‌های پیشرفته، مانعی جدی در برابر استفاده نادرست از این فناوری‌هاست.

مطالب مرتبط

هزاران مخزن جعلی GitHub کاربران و عامل‌های هوش مصنوعی را هدف گرفتند

حملات گسترده به وردپرس با دو آسیب‌پذیری بحرانی آغاز شد

باج‌افزار جدید ENCFORGE زیرساخت‌های هوش مصنوعی را هدف قرار داد

دیدگاه خود را بنویسید لغو پاسخ