ШІ

Google показала ШІ, який створює відео зі звуком: модель Veo 3 вже доступна

⠀Поширити:
Google представила Veo 3 — ШІ-модель, яка генерує відео зі звуком. Також оновили Imagen 4 для створення зображень та запустили інструмент перевірки на ШІ-вміст.

На конференції Google I/O компанія презентувала нову генеративну модель Veo 3 — першу в лінійці, що вміє створювати відео разом із відповідним звуковим супроводом. Це означає, що користувач може отримати, наприклад, відео пташок із характерним співом або міську вулицю зі звуками трафіку — і все це згенероване штучним інтелектом.

Окрім аудіо, Veo 3 покращила точність фізичної взаємодії об’єктів у кадрі та синхронізацію рухів губ. Поки що модель доступна тільки в США для передплатників Gemini Ultra через застосунок Gemini, а також для бізнес-користувачів у хмарному середовищі Vertex AI. Крім того, Veo 3 інтегрована в новий інструмент Flow — це платформа Google для створення відео з використанням ШІ.

Google показала ШІ, який створює відео зі звуком: модель Veo 3 вже доступна

Flow об’єднує можливості Veo, Imagen і Gemini. Користувач описує бажану сцену звичайною мовою, а система сама формує результат. Наразі Flow працює лише для передплатників AI Pro та Ultra у США, однак компанія обіцяє швидке розширення географії доступу.

Попередня версія — Veo 2 — також залишається активною. Вона дозволяє завантажувати зображення людей, об’єктів чи стилів для генерації референсів у Flow. Крім того, передбачене керування камерою: можна змінювати ракурс, масштабувати об’єкти, а також змінювати формат з вертикального на горизонтальний. Користувачі можуть додавати або прибирати елементи з відео прямо в інтерфейсі.



Окремо Google представила нову модель для генерації зображень — Imagen 4. За словами компанії, вона значно краще передає дрібні деталі, як-от текстури тканин чи хутро тварин. Imagen 4 підтримує фотогенерацію в різних форматах до 2K і стала значно точнішою у відображенні шрифтів. Вона вже доступна через додаток Gemini, у Vertex AI та в додатках Workspace, зокрема у Docs і Slides. Незабаром вийде ще швидша версія Imagen 4 — у 10 разів продуктивніша за Imagen 3.

Також Google анонсувала інструмент SynthID Detector. Це портал для перевірки медіафайлів на наявність цифрового водяного знака SynthID — технології, яку Google використовує для маркування ШІ-контенту. Хоча саму технологію було відкрито, не всі генератори зображень її підтримують, тому портал поки не розпізнає всі ШІ-роботи.


Google News
Channel Tech в Google News Актуальні новини та аналітика
Читати


🔗Джерело: Engadget
⠀Поширити:

Vitaliy Kairov

Засновник видання. Пишу про технології, гаджети та софт. Ціную об'єктивність, якісний звук та лаконічність.

Залишити відповідь

Ваша e-mail адреса не оприлюднюватиметься. Обов’язкові поля позначені *