کمیته رکن چهارم – استارتاپ آمریکایی Deep Cogito با خروج از وضعیت مخفی و معرفی مدلهای جدید هوش مصنوعی، گامی تازه در مسیر توسعه فناوریهای استدلالمحور برداشته است.

به گزارش کمیته رکن چهارم، شرکت نوپای Deep Cogito مستقر در سانفرانسیسکو، با رونمایی از مجموعهای از مدلهای بازمتن هوش مصنوعی با قابلیت «استدلال مرحلهای»، توجه جامعه فناوری را به خود جلب کرده است. این مدلها با قابلیت سوییچ میان حالتهای «پاسخ مستقیم» و «استدلالمحور»، نوآوری تازهای را در زمینه ترکیب سرعت و دقت در پردازشهای زبانی ارائه میدهند.
مدلهای این شرکت با عنوان Cogito 1 در بازهای ۷۵ روزه توسط تیمی کوچک توسعه یافتهاند و دامنه اندازه آنها از ۳ تا ۷۰ میلیارد پارامتر را در بر میگیرد. شرکت همچنین اعلام کرده نسخههایی با ظرفیت بالاتر (تا ۶۷۱ میلیارد پارامتر) نیز در آینده نزدیک عرضه خواهد شد.
این مدلها بهصورت مستقیم بر پایه نسخههای بازمتن LLaMA متعلق به شرکت Meta و Qwen متعلق به Alibaba توسعه یافتهاند، اما با بهرهگیری از رویکردهای آموزشی جدید، امکان فعالسازی یا غیرفعالسازی فرآیندهای استدلالمحور در پاسخگویی را دارا هستند. در آزمونهای مختلف، مدل Cogito 70B در حالت استدلالی عملکردی بالاتر از مدل R1 متعلق به شرکت DeepSeek و در حالت غیراستدلالی عملکرد بهتری نسبت به LLaMA 4 Scout شرکت Meta نشان داده است.
دسترسی به این مدلها از طریق پلتفرمهای Fireworks AI و Together AI برای توسعهدهندگان ممکن شده و امکان بهرهبرداری از آنها از طریق API نیز فراهم است.
به گفته منابع نزدیک به این شرکت، Deep Cogito قصد دارد در آینده از روشهای «آموزش پسازپایان» (post-training) برای ارتقای خودکار عملکرد مدلها بهره گیرد. این شرکت که در ژوئن ۲۰۲۴ تأسیس شده، توسط دو کارشناس سابق گوگل و DeepMind رهبری میشود و از حمایت مالی مجموعه South Park Commons برخوردار است.
هدف اعلامشده این شرکت، ساخت «هوش مصنوعی عمومی و فراگیر» است — مدلی که بتواند فراتر از توانایی ذهنی انسانها عمل کند و در مسیر کشف قابلیتهایی حرکت کند که هنوز ناشناخته باقی ماندهاند.
