کمیته رکن چهارم – شرکت گوگل اعلام کرده است که مدل هوش مصنوعی تولید ویدیوی خود با نام Veo 2 را به نسخه پیشرفته پلتفرم Gemini افزوده است. این ابزار جدید هماکنون برای کاربران دارای اشتراک پولی Gemini Advanced در دسترس قرار گرفته است.
به گزارش کمیته رکن چهارم، مدل Veo 2 توانایی تولید ویدیوهایی با طول ۸ ثانیه، کیفیت ۷۲۰p و نسبت تصویر ۱۶:۹ را دارد. کاربران میتوانند ویدیوهای تولیدشده را بهصورت فایل MP4 ذخیره کرده یا مستقیماً در پلتفرمهایی مانند TikTok و YouTube به اشتراک بگذارند. ویدیوهای ایجادشده توسط این مدل دارای واترمارک مخصوص فناوری SynthID گوگل هستند و محدودیت ماهانهای نیز برای تعداد خروجیها در نظر گرفته شده است.
این قابلیت بخشی از تلاشهای گوگل برای رقابت با مدل Sora شرکت OpenAI و همچنین مدلهای ویدیویی توسعهیافته توسط سایر شرکتها نظیر Runway محسوب میشود. شرکت Runway تنها چند هفته پیش از نسل چهارم مدل تولید ویدیوی خود رونمایی کرد و موفق به جذب بیش از ۳۰۰ میلیون دلار سرمایه شد.
در همین راستا، گوگل از ادغام Veo 2 با قابلیت Whisk در Google Labs نیز خبر داده است. Whisk به کاربران امکان میدهد با استفاده از تصویر بهعنوان ورودی، محتوای جدید تولید کرده و سپس از طریق قابلیت Whisk Animate، آن را به ویدیوهای ۸ ثانیهای تبدیل کنند. دسترسی به این ابزار نیازمند اشتراک Google One AI Premium است که هزینهای معادل ۲۰ دلار در ماه دارد.
هدف گوگل از توسعه Veo 2، ترکیب آن با مدلهای زبان بزرگ مانند Gemini و ارتقاء توانایی درک آنها از محیطهای واقعی و فیزیکی است. مدیرعامل Google DeepMind نیز در همین زمینه اعلام کرده که ادغام Veo با Gemini بخشی از نقشه راه توسعه آینده این پلتفرم است.
با این حال، پیشرفت سریع فناوریهای تولید محتوای بصری توسط هوش مصنوعی باعث افزایش نگرانی در میان هنرمندان، انیماتورها و تولیدکنندگان محتوا شده است. بر اساس مطالعهای که در سال ۲۰۲۴ توسط اتحادیه Animation Guild انجام شد، پیشبینی میشود تا سال ۲۰۲۶ بیش از ۱۰۰ هزار شغل در صنایع فیلم، تلویزیون و انیمیشن ایالات متحده تحت تأثیر این فناوریها قرار گیرد.