گوگل در مسیر توسعه مدل‌های اومنی؛ ادغام Gemini و Veo برای درک بهتر دنیای فیزیکی

فروردین ۲۴, ۱۴۰۴ نوشتهٔ hraicp3 بدون نظر

کمیته رکن چهارم – دمیس حسابیس، مدیرعامل شرکت دیپ‌مایند، از برنامه گوگل برای ادغام دو مدل هوش مصنوعی پیشرفته خود، یعنی «جمینای» و «وئو»، خبر داد. به گفته او، هدف از این اقدام ارتقای توانایی درک مدل‌های هوش مصنوعی از دنیای واقعی و تقویت قابلیت‌های چندوجهی آن‌هاست.

به گزارش کمیته رکن چهارم به نقل از تک‌کرانچ، حسابیس گفت: «ما جمینای را از ابتدا چندوجهی طراحی کردیم تا بتواند به عنوان دستیار دیجیتال جهانی در زندگی روزمره کاربران ایفای نقش کند. صنعت هوش مصنوعی به سمت مدل‌های ‘اومنی’ حرکت می‌کند؛ مدل‌هایی که می‌توانند متن، تصویر، صدا و ویدئو را هم‌زمان درک و ترکیب کنند.»

به گفته حسابیس، مدل ویدئوساز Veo نیز در نسخه دوم خود (Veo 2)، با تحلیل حجم عظیمی از ویدئوهای موجود در پلتفرم یوتیوب، قادر به یادگیری فیزیک جهان خواهد بود. او تلویحاً تأیید کرد که این ویدئوها، به پشتوانه مالکیت گوگل بر یوتیوب و توافقات احتمالی با سازندگان محتوا، مبنای آموزشی مدل‌های تصویری گوگل قرار می‌گیرند.

هم‌زمان، دیگر شرکت‌های بزرگ فناوری نیز در مسیر مشابهی حرکت می‌کنند. آمازون اعلام کرده که در اواخر سال جاری میلادی از مدل اومنی خود با عنوان «any-to-any» رونمایی خواهد کرد.

گزارش‌ها حاکی است گوگل نیز در سال گذشته شرایط خدمات خود را تغییر داده تا دسترسی گسترده‌تری به داده‌های پلتفرم یوتیوب برای آموزش مدل‌های هوش مصنوعی خود فراهم کند؛ موضوعی که می‌تواند بار دیگر مباحث مربوط به حریم خصوصی و مالکیت داده را در مرکز توجه قرار دهد.

مطالب مرتبط

حمله یک عامل هوش مصنوعی به پلتفرم Hugging Face تأیید شد

آسیب‌پذیری بحرانی nginx امکان اجرای کد از راه دور را فراهم می‌کند

سه بسته مخرب در RubyGems توسعه‌دهندگان Ruby را هدف قرار دادند

دیدگاه خود را بنویسید لغو پاسخ