Google запустила Gemini Omni для генерації відео з будь-яких даних
- Google представила Gemini Omni Flash для генерації відео.
- Модель поєднує зображення, аудіо, відео та текст.
- Користувачі можуть редагувати ролики у форматі розмови.
- Gemini Omni краще враховує фізику сцен і контекст.
- Запуск уже почався для підписників Google AI та YouTube.
Google представила Gemini Omni — нову модель для генерації відео з будь-якого типу вхідних даних, яка починає розгортатися з версії Gemini Omni Flash. Про це компанія повідомила на Google I/O 2026.
Модель може поєднувати зображення, аудіо, відео та текст для створення якісного відео з урахуванням знань Gemini про реальний світ. Користувачі зможуть редагувати ролики у форматі звичайної розмови, а кожна нова команда враховуватиме попередні зміни, щоб зберігати сталість персонажів та інших елементів.
На відміну від попереднього генератора Veo 3.1, Gemini Omni приймає ширший набір джерел і дозволяє змінювати готове відео після його створення. Серед можливостей — зміна дії, додавання нових персонажів або об’єктів, а також зміна середовища, ракурсу, стилю чи окремих деталей.
Google заявляє, що Omni краще розуміє фізичні процеси, зокрема гравітацію, кінетичну енергію та динаміку рідин. Компанія також підкреслює, що модель може створювати пояснювальні ролики з коротких підказок і візуально розкривати складні ідеї.
На старті аудіовихід підтримуватиме лише голосові посилання. Окремо Google тестує можливість змінювати аудіо та мовлення у відео. Усі ролики отримають цифровий водяний знак SynthID.
Gemini Omni Flash вже доступна підписникам Google AI Plus, Pro та Ultra по всьому світу, а також почала розгортатися для YouTube Shorts і застосунку YouTube Create.
