Google випустила Imagen 4 та Imagen 4 Ultra: нові ШІ-моделі для генерації зображень з покращеним текстом
- Google випустила Imagen 4 — нову текстово-візуальну модель для генерації зображень, що має “значно покращене відображення тексту”.
- Представлено також версію Imagen 4 Ultra з підвищеною точністю відповідності до запитів.
- Обидві моделі доступні для обмеженого тестування у Google AI Studio та через платну передплату API Gemini.
- Ціна Imagen 4 становить $0,04 за зображення, а Imagen 4 Ultra — $0,06.
- Google позиціонує Imagen 4 як конкурента Dall-E 3 та Midjourney 7.
Google випустила Imagen 4 — нову текстово-візуальну модель для генерації зображень, яка, за словами компанії, демонструє “значно покращене відображення тексту” порівняно з попередніми версіями. Разом з нею представлено варіант Imagen 4 Ultra з підвищеною точністю відповідності до інструкцій у запиті.
Компанія вперше анонсувала нову модель на заході Google I/O у травні цього року. Тепер обидві моделі стають доступними для обмеженого тестування у Google AI Studio, а також через платну передплату API Gemini.
Звичайна версія Imagen 4 коштує $0,04 за зображення і призначена для більшості популярних завдань генерації. Ultra-версія орієнтована на більш вимогливі сценарії з точним дотриманням опису і коштує $0,06 за зображення.
У прикладах, наведених Google, Imagen 4 Ultra змогла згенерувати сторінку комікса за складним промптом та листівку в стилі ретро з пейзажем Кіото. Однак, варто зазначити, що реалістичні зображення досі мають характерний “штучний” вигляд, за яким легко розпізнати, що вони створені нейромережею.
Google позиціонує Imagen 4 як прямого конкурента іншим генераторам зображень, зокрема Dall-E 3 та Midjourney 7.
