غول جدید هوش مصنوعی با عملکردی فراتر از انتظارات

دی ۷, ۱۴۰۳ نوشتهٔ nastaran بدون نظر

کمیته رکن چهارم – یک آزمایشگاه هوش مصنوعی چینی مدلی جدید به نام «DeepSeek V3» معرفی کرده که توانایی‌های قابل‌توجهی در پردازش متن و کدنویسی دارد.

به گزارش کمیته رکن چهارم، این مدل اخیراً با مجوزی کم‌محدودیت منتشر شده که به توسعه‌دهندگان امکان تغییر و استفاده تجاری را می‌دهد. این فناوری در آزمایش‌های بنچمارک، عملکردی برتر نسبت به دیگر مدل‌های مشابه نشان داده است.

DeepSeek V3 با مجموعه داده‌ای عظیم به حجم ۱۴٫۸ تریلیون توکن و ۶۷۱ میلیارد پارامتر توسعه یافته است. توکن‌ها، کوچک‌ترین واحدهای پردازش متن هستند که مدل برای تحلیل داده‌ها از آن‌ها استفاده می‌کند. این توانمندی‌ها آن را از رقبایی مانند «Llama 3.1 405B» و «GPT-4o» متمایز کرده، هرچند اجرای آن به سخت‌افزار پیشرفته نیاز دارد.

اگرچه این مدل به دلیل پیشرفته بودن مورد تحسین قرار گرفته، اما محدودیت‌های سیاسی و امنیتی همچنان چالشی برای استفاده گسترده آن محسوب می‌شود. برای مثال، از پاسخ‌دهی به موضوعات حساس خودداری می‌کند. با این وجود، هزینه و زمان آموزش کم آن نسبت به مدل‌های مشابه، نقطه قوتی برجسته به شمار می‌رود.

این دستاورد، گامی مهم در پیشرفت هوش مصنوعی باز محسوب می‌شود، هرچند چالش‌های جغرافیایی و محدودیت‌های قانونی ممکن است استفاده آن را محدود کند.

مطالب مرتبط

آسیب‌پذیری ChatGPT امکان ساخت عامل مخفی در سازمان‌ها را فراهم می‌کرد

افزونه جعلی Notepad++ برای آلوده‌سازی ویندوز استفاده شد

آسیب‌پذیری افزونه Adobe Acrobat داده‌های واتس‌اپ را در معرض سرقت قرار داد

دیدگاه خود را بنویسید لغو پاسخ