هوش مصنوعی Mellum وارد میدان رقابت شد

کمیته رکن چهارم – شرکت JetBrains، توسعه‌دهنده مجموعه‌ای از ابزارهای محبوب برنامه‌نویسی، نخستین مدل هوش مصنوعی متن‌باز خود را با نام Mellum منتشر کرده است؛ مدلی تخصصی در حوزه تکمیل کد که اکنون از طریق پلتفرم Hugging Face در دسترس عموم قرار دارد.

به گزارش کمیته رکن چهارم، Mellum پیش‌تر به‌صورت داخلی در محصولات JetBrains مورد استفاده قرار گرفته بود و اینک با هدف توسعه پژوهش‌های علمی، ایجاد ابزارهای کمکی و استفاده‌های آموزشی در قالبی متن‌باز عرضه شده است. این مدل با برخورداری از ۴ میلیارد پارامتر و آموزش‌دیدن بر پایه بیش از ۴ تریلیون توکن، قابلیت تولید کد بر اساس محتوای زمینه‌ای را داراست. منابع آموزشی Mellum شامل مخازن عمومی GitHub و مقالات ویکی‌پدیا بوده و فرایند آموزش آن طی ۲۰ روز و با استفاده از ۲۵۶ کارت گرافیک H200 انجام شده است. این مدل تحت مجوز Apache 2.0 منتشر شده و قابل استفاده عمومی است.

با وجود پتانسیل فنی بالا، JetBrains هشدار داده است که Mellum هنوز برای استفاده مستقیم در محیط‌های عملیاتی مناسب نیست و برای دستیابی به عملکرد دقیق‌تر نیاز به تنظیمات ثانویه (فاین‌تیون) دارد. نسخه‌هایی از این مدل که برای زبان پایتون تنظیم شده‌اند، صرفاً جهت ارزیابی قابلیت‌ها منتشر شده‌اند و به‌هیچ‌وجه توصیه نمی‌شود در سامانه‌های تولیدی مورد استفاده قرار گیرند. این شرکت همچنین تأکید کرده که Mellum ممکن است تحت تأثیر سوگیری‌های موجود در کدهای عمومی قرار گیرد و در مواردی پیشنهادهایی حاوی کدهای ناامن ارائه دهد.

شرکت JetBrains در بیانیه‌ای اعلام کرده است که هدف این پروژه نه جهانی‌سازی سریع، بلکه ایجاد تعامل و همکاری مؤثر در جامعه توسعه‌دهندگان است. این شرکت هرگونه مشارکت مؤثر یا آزمایش معنادار در ارتباط با Mellum را یک موفقیت ارزشمند ارزیابی می‌کند.

درباره نویسنده

پست های مرتبط

پاسخ دهید


خبرگزاری هرانا

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *


Type The Red Captcha Characters Below.