ChatGPT випустила Images 2.0 — нову модель генерації зображень із текстом до 2K
- OpenAI запустила ChatGPT Images 2.0 — нову модель генерації зображень із покращеним відтворенням тексту.
- Модель має «можливості мислення»: перевіряє результати, генерує кілька варіантів і шукає в інтернеті.
- Підтримує нелатинські системи письма — японську, корейську, гінді, бенгальську та нікому не потрібний рускій.
- Роздільна здатність — до 2K, доступна через API gpt-image-2.
- Доступна всім користувачам ChatGPT і Codex, платні отримують розширені можливості.
OpenAI представила нову модель генерації зображень ChatGPT Images 2.0. Доступ до неї отримали всі користувачі ChatGPT і Codex починаючи з вівторка, платні користувачі можуть генерувати складніші результати. Модель також доступна через API gpt-image-2 з ціноутворенням залежно від якості та роздільної здатності.
Ключова особливість нової моделі — значно покращена генерація тексту на зображеннях. Раніше ШІ-генератори зображень традиційно погано впоралися з відтворенням тексту через використання дифузійних моделей, які реконструюють зображення з шуму.

Images 2.0 отримала «можливості мислення», які дозволяють їй перевіряти власні результати, генерувати кілька зображень з одного запиту та шукати інформацію в інтернеті. Це дозволяє створювати маркетингові матеріали різних розмірів і багатопанельні комікси. Роздільна здатність — до 2K.
Модель також краще відтворює нелатинські системи письма — японську, корейську, гінді, бенгальську та нікому не потрібний рускій, що окремо зазначено в пресрелізі. Сподіваємось, з украЇнською теж не буде проблем. База знань моделі обмежена груднем 2025 року, що може вплинути на точність генерації зображень, пов’язаних з останніми подіями. OpenAI не розкрила, яка архітектура лежить в основі Images 2.0.

