هوش مصنوعی جدیدی که قبل از پاسخ، فکر می‌کند

فروردین ۲۰, ۱۴۰۴ نوشتهٔ nastaran بدون نظر

کمیته رکن چهارم – استارتاپ آمریکایی Deep Cogito با خروج از وضعیت مخفی و معرفی مدل‌های جدید هوش مصنوعی، گامی تازه در مسیر توسعه فناوری‌های استدلال‌محور برداشته است.

به گزارش کمیته رکن چهارم، شرکت نوپای Deep Cogito مستقر در سان‌فرانسیسکو، با رونمایی از مجموعه‌ای از مدل‌های بازمتن هوش مصنوعی با قابلیت «استدلال مرحله‌ای»، توجه جامعه فناوری را به خود جلب کرده است. این مدل‌ها با قابلیت سوییچ میان حالت‌های «پاسخ مستقیم» و «استدلال‌محور»، نوآوری تازه‌ای را در زمینه ترکیب سرعت و دقت در پردازش‌های زبانی ارائه می‌دهند.

مدل‌های این شرکت با عنوان Cogito 1 در بازه‌ای ۷۵ روزه توسط تیمی کوچک توسعه یافته‌اند و دامنه‌ اندازه آن‌ها از ۳ تا ۷۰ میلیارد پارامتر را در بر می‌گیرد. شرکت همچنین اعلام کرده نسخه‌هایی با ظرفیت بالاتر (تا ۶۷۱ میلیارد پارامتر) نیز در آینده نزدیک عرضه خواهد شد.

این مدل‌ها به‌صورت مستقیم بر پایه نسخه‌های بازمتن LLaMA متعلق به شرکت Meta و Qwen متعلق به Alibaba توسعه یافته‌اند، اما با بهره‌گیری از رویکردهای آموزشی جدید، امکان فعال‌سازی یا غیرفعال‌سازی فرآیندهای استدلال‌محور در پاسخ‌گویی را دارا هستند. در آزمون‌های مختلف، مدل Cogito 70B در حالت استدلالی عملکردی بالاتر از مدل R1 متعلق به شرکت DeepSeek و در حالت غیراستدلالی عملکرد بهتری نسبت به LLaMA 4 Scout شرکت Meta نشان داده است.

دسترسی به این مدل‌ها از طریق پلتفرم‌های Fireworks AI و Together AI برای توسعه‌دهندگان ممکن شده و امکان بهره‌برداری از آن‌ها از طریق API نیز فراهم است.

به گفته منابع نزدیک به این شرکت، Deep Cogito قصد دارد در آینده از روش‌های «آموزش پس‌ازپایان» (post-training) برای ارتقای خودکار عملکرد مدل‌ها بهره گیرد. این شرکت که در ژوئن ۲۰۲۴ تأسیس شده، توسط دو کارشناس سابق گوگل و DeepMind رهبری می‌شود و از حمایت مالی مجموعه South Park Commons برخوردار است.

هدف اعلام‌شده این شرکت، ساخت «هوش مصنوعی عمومی و فراگیر» است — مدلی که بتواند فراتر از توانایی ذهنی انسان‌ها عمل کند و در مسیر کشف قابلیت‌هایی حرکت کند که هنوز ناشناخته باقی مانده‌اند.

Cogito 1 Deep Cogito Fireworks AI Llama post-training Qwen Together AI استارتاپ فناوری استدلال‌محور مدل بازمتن مدل ترکیبی مدل زبانی هوش مصنوعی‌هوش مصنوعی عمومی یادگیری ماشینی

مطالب مرتبط

هزاران مخزن جعلی GitHub کاربران و عامل‌های هوش مصنوعی را هدف گرفتند

حملات گسترده به وردپرس با دو آسیب‌پذیری بحرانی آغاز شد

باج‌افزار جدید ENCFORGE زیرساخت‌های هوش مصنوعی را هدف قرار داد

دیدگاه خود را بنویسید لغو پاسخ