کمیته رکن چهارم – یک آزمایشگاه هوش مصنوعی چینی مدلی جدید به نام «DeepSeek V3» معرفی کرده که تواناییهای قابلتوجهی در پردازش متن و کدنویسی دارد.
به گزارش کمیته رکن چهارم، این مدل اخیراً با مجوزی کممحدودیت منتشر شده که به توسعهدهندگان امکان تغییر و استفاده تجاری را میدهد. این فناوری در آزمایشهای بنچمارک، عملکردی برتر نسبت به دیگر مدلهای مشابه نشان داده است.
DeepSeek V3 با مجموعه دادهای عظیم به حجم ۱۴٫۸ تریلیون توکن و ۶۷۱ میلیارد پارامتر توسعه یافته است. توکنها، کوچکترین واحدهای پردازش متن هستند که مدل برای تحلیل دادهها از آنها استفاده میکند. این توانمندیها آن را از رقبایی مانند «Llama 3.1 405B» و «GPT-4o» متمایز کرده، هرچند اجرای آن به سختافزار پیشرفته نیاز دارد.
اگرچه این مدل به دلیل پیشرفته بودن مورد تحسین قرار گرفته، اما محدودیتهای سیاسی و امنیتی همچنان چالشی برای استفاده گسترده آن محسوب میشود. برای مثال، از پاسخدهی به موضوعات حساس خودداری میکند. با این وجود، هزینه و زمان آموزش کم آن نسبت به مدلهای مشابه، نقطه قوتی برجسته به شمار میرود.
این دستاورد، گامی مهم در پیشرفت هوش مصنوعی باز محسوب میشود، هرچند چالشهای جغرافیایی و محدودیتهای قانونی ممکن است استفاده آن را محدود کند.