از تصویر تا صدا؛ همه‌چیز با Veo 3

کمیته رکن چهارم – گوگل در رویداد Google I/O 2025 از نسخه جدید مدل هوش مصنوعی ویدیوساز خود با نام Veo 3 رونمایی کرد؛ مدلی که به‌طور مستقیم رقیب OpenAI Sora محسوب می‌شود اما با یک ویژگی مهم متمایز شده است: قابلیت تولید صدا هم‌زمان با ویدیو.

به گزارش کمیته رکن چهارم، Veo 3 نه‌تنها می‌تواند از متن یا تصویر، ویدیو تولید کند، بلکه قادر است صدای مرتبط با ویدیو را نیز بسازد؛ مانند آواز پرندگان یا صدای ترافیک در یک صحنه شهری. این مدل همچنین می‌تواند دیالوگ بسازد و حرکات لب شخصیت‌ها را با صدا هماهنگ کند. گوگل می‌گوید این مدل حالا درک بهتری از فیزیک دنیای واقعی دارد.

مدل Veo 3 از امروز برای مشترکان پولی گوگل در آمریکا با اشتراک Ultra به قیمت ماهانه ۲۴۹ دلار فعال شده و همچنین از طریق پلتفرم سازمانی Vertex AI نیز در دسترس است.

کاربران همچنین می‌توانند از این مدل در ابزار فیلم‌سازی جدید گوگل به نام Flow استفاده کنند. این ابزار با ترکیب Veo، Imagen و Gemini به کاربران اجازه می‌دهد فقط با نوشتن یک توصیف طبیعی، صحنه سینمایی موردنظر خود را تولید کنند. گوگل اعلام کرده که در طراحی این ابزار با فعالان صنعت سینما همکاری نزدیکی داشته است.

از نظر بصری نیز Veo 3 بهبود یافته و با استفاده از ارتقاهای فنی جدید، خروجی‌هایی روان‌تر، یکپارچه‌تر و واقع‌گرایانه‌تر ارائه می‌دهد. با این مدل، کاربران می‌توانند داستان‌های خود را از ایده به ویدیو تبدیل کنند و به‌راحتی روی آن صدا بگذارند — روندی که حالا ساده‌تر و سریع‌تر از همیشه شده است.

درباره نویسنده

پست های مرتبط

پاسخ دهید


خبرگزاری هرانا

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *


Type The Blue Captcha Characters Below.