Google презентувала Whisk — новий ШІ-інструмент для швидкого створення зображень з інших зображень
Google анонсувала Whisk — інноваційний інструмент для генерації зображень за допомогою штучного інтелекту. Головна особливість Whisk полягає у можливості використовувати інші зображення як підказки, замість звичайних текстових запитів.
Як працює Whisk: зображення як підказка
З Whisk користувачі можуть завантажувати зображення для визначення об’єкта, сцени та стилю. Цікаво, що для кожної з цих категорій можна завантажити декілька зображень одночасно. Якщо підходящих зображень немає, інструмент пропонує випадкові зображення, які теж генеруються за допомогою ШІ.




Для додаткового налаштування можна додати текстовий опис на будь-якому етапі створення. Але цей крок не є обов’язковим.
Після обробки даних Whisk генерує зображення разом із текстовим запитом, що лежить в основі результату. Користувачі можуть:
- Завантажити зображення, якщо воно відповідає очікуванням.
- Редагувати результати, додавши більше тексту або змінивши запит.
Google про Whisk: швидка генерація, а не точне редагування
У своєму блозі Google підкреслила, що Whisk орієнтований на швидкий візуальний пошук і експерименти, а не на піксельно-точне редагування. Компанія також визнає, що інструмент іноді може “помилятися” у результатах, тому передбачена можливість корекції початкових підказок.
Whisk базується на новітній версії моделі Imagen 3, яку Google також анонсувала раніше. Крім того, компанія представила Veo 2 — наступне покоління моделі для генерації відео.
Google заявляє, що Veo 2 краще розуміє кінематографічну мову та рідше припускається помилок, як-от зайві пальці на руках. Першими користувачами Veo 2 стануть ті, хто зареєструється у Google Labs для інструменту VideoFX. Очікується, що Veo 2 з’явиться у YouTube Shorts та інших продуктах вже у 2025 році.