Google показала ШІ, який створює відео зі звуком: модель Veo 3 вже доступна
На конференції Google I/O компанія презентувала нову генеративну модель Veo 3 — першу в лінійці, що вміє створювати відео разом із відповідним звуковим супроводом. Це означає, що користувач може отримати, наприклад, відео пташок із характерним співом або міську вулицю зі звуками трафіку — і все це згенероване штучним інтелектом.
Окрім аудіо, Veo 3 покращила точність фізичної взаємодії об’єктів у кадрі та синхронізацію рухів губ. Поки що модель доступна тільки в США для передплатників Gemini Ultra через застосунок Gemini, а також для бізнес-користувачів у хмарному середовищі Vertex AI. Крім того, Veo 3 інтегрована в новий інструмент Flow — це платформа Google для створення відео з використанням ШІ.

Flow об’єднує можливості Veo, Imagen і Gemini. Користувач описує бажану сцену звичайною мовою, а система сама формує результат. Наразі Flow працює лише для передплатників AI Pro та Ultra у США, однак компанія обіцяє швидке розширення географії доступу.
Попередня версія — Veo 2 — також залишається активною. Вона дозволяє завантажувати зображення людей, об’єктів чи стилів для генерації референсів у Flow. Крім того, передбачене керування камерою: можна змінювати ракурс, масштабувати об’єкти, а також змінювати формат з вертикального на горизонтальний. Користувачі можуть додавати або прибирати елементи з відео прямо в інтерфейсі.
Окремо Google представила нову модель для генерації зображень — Imagen 4. За словами компанії, вона значно краще передає дрібні деталі, як-от текстури тканин чи хутро тварин. Imagen 4 підтримує фотогенерацію в різних форматах до 2K і стала значно точнішою у відображенні шрифтів. Вона вже доступна через додаток Gemini, у Vertex AI та в додатках Workspace, зокрема у Docs і Slides. Незабаром вийде ще швидша версія Imagen 4 — у 10 разів продуктивніша за Imagen 3.
Також Google анонсувала інструмент SynthID Detector. Це портал для перевірки медіафайлів на наявність цифрового водяного знака SynthID — технології, яку Google використовує для маркування ШІ-контенту. Хоча саму технологію було відкрито, не всі генератори зображень її підтримують, тому портал поки не розпізнає всі ШІ-роботи.
