کمیته رکن چهارم – گوگل در رویداد Google I/O 2025 از نسخه جدید مدل هوش مصنوعی ویدیوساز خود با نام Veo 3 رونمایی کرد؛ مدلی که بهطور مستقیم رقیب OpenAI Sora محسوب میشود اما با یک ویژگی مهم متمایز شده است: قابلیت تولید صدا همزمان با ویدیو.

به گزارش کمیته رکن چهارم، Veo 3 نهتنها میتواند از متن یا تصویر، ویدیو تولید کند، بلکه قادر است صدای مرتبط با ویدیو را نیز بسازد؛ مانند آواز پرندگان یا صدای ترافیک در یک صحنه شهری. این مدل همچنین میتواند دیالوگ بسازد و حرکات لب شخصیتها را با صدا هماهنگ کند. گوگل میگوید این مدل حالا درک بهتری از فیزیک دنیای واقعی دارد.
مدل Veo 3 از امروز برای مشترکان پولی گوگل در آمریکا با اشتراک Ultra به قیمت ماهانه ۲۴۹ دلار فعال شده و همچنین از طریق پلتفرم سازمانی Vertex AI نیز در دسترس است.
کاربران همچنین میتوانند از این مدل در ابزار فیلمسازی جدید گوگل به نام Flow استفاده کنند. این ابزار با ترکیب Veo، Imagen و Gemini به کاربران اجازه میدهد فقط با نوشتن یک توصیف طبیعی، صحنه سینمایی موردنظر خود را تولید کنند. گوگل اعلام کرده که در طراحی این ابزار با فعالان صنعت سینما همکاری نزدیکی داشته است.
از نظر بصری نیز Veo 3 بهبود یافته و با استفاده از ارتقاهای فنی جدید، خروجیهایی روانتر، یکپارچهتر و واقعگرایانهتر ارائه میدهد. با این مدل، کاربران میتوانند داستانهای خود را از ایده به ویدیو تبدیل کنند و بهراحتی روی آن صدا بگذارند — روندی که حالا سادهتر و سریعتر از همیشه شده است.
