کمیته رکن چهارم – شرکت JetBrains، توسعهدهنده مجموعهای از ابزارهای محبوب برنامهنویسی، نخستین مدل هوش مصنوعی متنباز خود را با نام Mellum منتشر کرده است؛ مدلی تخصصی در حوزه تکمیل کد که اکنون از طریق پلتفرم Hugging Face در دسترس عموم قرار دارد.

به گزارش کمیته رکن چهارم، Mellum پیشتر بهصورت داخلی در محصولات JetBrains مورد استفاده قرار گرفته بود و اینک با هدف توسعه پژوهشهای علمی، ایجاد ابزارهای کمکی و استفادههای آموزشی در قالبی متنباز عرضه شده است. این مدل با برخورداری از ۴ میلیارد پارامتر و آموزشدیدن بر پایه بیش از ۴ تریلیون توکن، قابلیت تولید کد بر اساس محتوای زمینهای را داراست. منابع آموزشی Mellum شامل مخازن عمومی GitHub و مقالات ویکیپدیا بوده و فرایند آموزش آن طی ۲۰ روز و با استفاده از ۲۵۶ کارت گرافیک H200 انجام شده است. این مدل تحت مجوز Apache 2.0 منتشر شده و قابل استفاده عمومی است.
با وجود پتانسیل فنی بالا، JetBrains هشدار داده است که Mellum هنوز برای استفاده مستقیم در محیطهای عملیاتی مناسب نیست و برای دستیابی به عملکرد دقیقتر نیاز به تنظیمات ثانویه (فاینتیون) دارد. نسخههایی از این مدل که برای زبان پایتون تنظیم شدهاند، صرفاً جهت ارزیابی قابلیتها منتشر شدهاند و بههیچوجه توصیه نمیشود در سامانههای تولیدی مورد استفاده قرار گیرند. این شرکت همچنین تأکید کرده که Mellum ممکن است تحت تأثیر سوگیریهای موجود در کدهای عمومی قرار گیرد و در مواردی پیشنهادهایی حاوی کدهای ناامن ارائه دهد.
شرکت JetBrains در بیانیهای اعلام کرده است که هدف این پروژه نه جهانیسازی سریع، بلکه ایجاد تعامل و همکاری مؤثر در جامعه توسعهدهندگان است. این شرکت هرگونه مشارکت مؤثر یا آزمایش معنادار در ارتباط با Mellum را یک موفقیت ارزشمند ارزیابی میکند.
