غول جدید هوش مصنوعی با عملکردی فراتر از انتظارات

کمیته رکن چهارم – یک آزمایشگاه هوش مصنوعی چینی مدلی جدید به نام «DeepSeek V3» معرفی کرده که توانایی‌های قابل‌توجهی در پردازش متن و کدنویسی دارد.

به گزارش کمیته رکن چهارم، این مدل اخیراً با مجوزی کم‌محدودیت منتشر شده که به توسعه‌دهندگان امکان تغییر و استفاده تجاری را می‌دهد. این فناوری در آزمایش‌های بنچمارک، عملکردی برتر نسبت به دیگر مدل‌های مشابه نشان داده است.

DeepSeek V3 با مجموعه داده‌ای عظیم به حجم ۱۴٫۸ تریلیون توکن و ۶۷۱ میلیارد پارامتر توسعه یافته است. توکن‌ها، کوچک‌ترین واحدهای پردازش متن هستند که مدل برای تحلیل داده‌ها از آن‌ها استفاده می‌کند. این توانمندی‌ها آن را از رقبایی مانند «Llama 3.1 405B» و «GPT-4o» متمایز کرده، هرچند اجرای آن به سخت‌افزار پیشرفته نیاز دارد.

اگرچه این مدل به دلیل پیشرفته بودن مورد تحسین قرار گرفته، اما محدودیت‌های سیاسی و امنیتی همچنان چالشی برای استفاده گسترده آن محسوب می‌شود. برای مثال، از پاسخ‌دهی به موضوعات حساس خودداری می‌کند. با این وجود، هزینه و زمان آموزش کم آن نسبت به مدل‌های مشابه، نقطه قوتی برجسته به شمار می‌رود.

این دستاورد، گامی مهم در پیشرفت هوش مصنوعی باز محسوب می‌شود، هرچند چالش‌های جغرافیایی و محدودیت‌های قانونی ممکن است استفاده آن را محدود کند.

درباره نویسنده

پست های مرتبط

پاسخ دهید


خبرگزاری هرانا

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *


Type The Blue Captcha Characters Below.