از تصویر تا صدا؛ همه‌چیز با Veo ۳

خرداد ۱, ۱۴۰۴ نوشتهٔ nastaran بدون نظر

کمیته رکن چهارم – گوگل در رویداد Google I/O 2025 از نسخه جدید مدل هوش مصنوعی ویدیوساز خود با نام Veo 3 رونمایی کرد؛ مدلی که به‌طور مستقیم رقیب OpenAI Sora محسوب می‌شود اما با یک ویژگی مهم متمایز شده است: قابلیت تولید صدا هم‌زمان با ویدیو.

به گزارش کمیته رکن چهارم، Veo 3 نه‌تنها می‌تواند از متن یا تصویر، ویدیو تولید کند، بلکه قادر است صدای مرتبط با ویدیو را نیز بسازد؛ مانند آواز پرندگان یا صدای ترافیک در یک صحنه شهری. این مدل همچنین می‌تواند دیالوگ بسازد و حرکات لب شخصیت‌ها را با صدا هماهنگ کند. گوگل می‌گوید این مدل حالا درک بهتری از فیزیک دنیای واقعی دارد.

مدل Veo 3 از امروز برای مشترکان پولی گوگل در آمریکا با اشتراک Ultra به قیمت ماهانه ۲۴۹ دلار فعال شده و همچنین از طریق پلتفرم سازمانی Vertex AI نیز در دسترس است.

کاربران همچنین می‌توانند از این مدل در ابزار فیلم‌سازی جدید گوگل به نام Flow استفاده کنند. این ابزار با ترکیب Veo، Imagen و Gemini به کاربران اجازه می‌دهد فقط با نوشتن یک توصیف طبیعی، صحنه سینمایی موردنظر خود را تولید کنند. گوگل اعلام کرده که در طراحی این ابزار با فعالان صنعت سینما همکاری نزدیکی داشته است.

از نظر بصری نیز Veo 3 بهبود یافته و با استفاده از ارتقاهای فنی جدید، خروجی‌هایی روان‌تر، یکپارچه‌تر و واقع‌گرایانه‌تر ارائه می‌دهد. با این مدل، کاربران می‌توانند داستان‌های خود را از ایده به ویدیو تبدیل کنند و به‌راحتی روی آن صدا بگذارند — روندی که حالا ساده‌تر و سریع‌تر از همیشه شده است.

مطالب مرتبط

هزاران مخزن جعلی GitHub کاربران و عامل‌های هوش مصنوعی را هدف گرفتند

حملات گسترده به وردپرس با دو آسیب‌پذیری بحرانی آغاز شد

باج‌افزار جدید ENCFORGE زیرساخت‌های هوش مصنوعی را هدف قرار داد

دیدگاه خود را بنویسید لغو پاسخ