کمیته رکن چهارم – دمیس حسابیس، مدیرعامل شرکت دیپمایند، از برنامه گوگل برای ادغام دو مدل هوش مصنوعی پیشرفته خود، یعنی «جمینای» و «وئو»، خبر داد. به گفته او، هدف از این اقدام ارتقای توانایی درک مدلهای هوش مصنوعی از دنیای واقعی و تقویت قابلیتهای چندوجهی آنهاست.
به گزارش کمیته رکن چهارم به نقل از تککرانچ، حسابیس گفت: «ما جمینای را از ابتدا چندوجهی طراحی کردیم تا بتواند به عنوان دستیار دیجیتال جهانی در زندگی روزمره کاربران ایفای نقش کند. صنعت هوش مصنوعی به سمت مدلهای ‘اومنی’ حرکت میکند؛ مدلهایی که میتوانند متن، تصویر، صدا و ویدئو را همزمان درک و ترکیب کنند.»
به گفته حسابیس، مدل ویدئوساز Veo نیز در نسخه دوم خود (Veo 2)، با تحلیل حجم عظیمی از ویدئوهای موجود در پلتفرم یوتیوب، قادر به یادگیری فیزیک جهان خواهد بود. او تلویحاً تأیید کرد که این ویدئوها، به پشتوانه مالکیت گوگل بر یوتیوب و توافقات احتمالی با سازندگان محتوا، مبنای آموزشی مدلهای تصویری گوگل قرار میگیرند.
همزمان، دیگر شرکتهای بزرگ فناوری نیز در مسیر مشابهی حرکت میکنند. آمازون اعلام کرده که در اواخر سال جاری میلادی از مدل اومنی خود با عنوان «any-to-any» رونمایی خواهد کرد.
گزارشها حاکی است گوگل نیز در سال گذشته شرایط خدمات خود را تغییر داده تا دسترسی گستردهتری به دادههای پلتفرم یوتیوب برای آموزش مدلهای هوش مصنوعی خود فراهم کند؛ موضوعی که میتواند بار دیگر مباحث مربوط به حریم خصوصی و مالکیت داده را در مرکز توجه قرار دهد.