اپل چند مدل هوش مصنوعی متن‌باز جدید منتشر کرد؛ رقیبی برای مدل‌های کوچک گوگل و متا

مرداد ۲, ۱۴۰۳ نوشتهٔ nr بدون نظر

کمیته رکن چهارم – مدل‌های جدید اپل به‌صورت متن‌باز اکنون برای محققان در دسترس هستند.

درحالی‌که توجه علاقه‌مندان هوش مصنوعی اخیراً به مدل جدید و ارزان GPT-4o mini جلب شده، اپل تصمیم گرفته خانواده مدل‌های کوچکش را گسترش دهد. به‌تازگی محققان اپل چند مدل‌ متن‌باز را تحت پروژه‌ای موسوم به DCLM منتشر کردند.

خانواده هوش مصنوعی جدید اپل شامل دو مدل اصلی است: یکی با ۷ میلیارد پارامتر و دیگری با ۱٫۴ میلیارد پارامتر. هر دوی آن‌ها در بنچمارک‌ها عملکرد بسیار خوبی دارند، به‌خصوص نمونه بزرگ‌تر که بهتر از مدل Mistral-7B است و می‌تواند با سایر مدل‌های متن‌باز پیشرو، مانند Llama 3 از متا و Gemma از گوگل رقابت کند.

مدل‌های هوش مصنوعی متن‌باز جدید اپل

محققان اپل این مدل‌های جدید را مدل‌های متن‌باز با بهترین عملکرد توصیف کرده‌اند. نکته‌ مهم این است که در این پروژه، با انتشار کد آموزشی و مجموعه داده‌های دیگر، مدل‌ها به‌صورت متن‌باز در Hugging Face در دسترس هستند. همچنین هر دو مدل در بنچمارک‌های MMLU امتیاز خوبی کسب کردند تا در برابر مدل‌های تجاری دیگر رقابت کنند.

به گفته محققان اپل، مدل بزرگ‌تر در مقایسه با MAP-Neo (پیشرفته‌ترین مدل متن‌باز قبلی اپل)، بهبود ۶٫۶ درصدی در بنچمارک‌ها داشته است؛ درحالی‌که تا ۴۰ درصد از محاسبات کمتری برای آموزش آن استفاده شده است. از سوی دیگر، درست مانند مدل بزرگ‌تر DCLM-7B، نسخه کوچک‌تر ۱٫۴B این مدل که روی ۲٫۶ تریلیون توکن آموزش دیده است، عملکرد قابل‌توجهی در تست‌های MMLU ،Core و Extended دارد.

اردیبهشت‌ماه نیز اپل از مدل‌های متن‌باز OpenELM رونمایی کرد که در چهار مدل مختلف ۲۷۰ میلیون پارامتری، ۴۵۰ میلیون پارامتری، ۱٫۱ میلیارد پارامتری و ۳ میلیارد پارامتری منتشر شد. به گفته اپل، این مدل‌ها در وظایف مربوط به پردازش متن ،مانند نوشتن ایمیل، عملکرد خوبی دارند.

مدل‌هایی که محققان اپل منتشر کرده‌اند، ظاهراً در هیچ‌یک از محصولات آینده اپل به‌ کار گرفته نمی‌شوند و بیشتر باید آن‌ها را پروژه‌های تحقیقاتی متن‌باز در نظر گرفت.

منبع : دیجیاتو