OpenAI випустила нові моделі o3 та o4-mini: штучний інтелект навчився «мислити зображеннями»
OpenAI представила моделі o3 та o4-mini, які вміють “мислити зображеннями”, комбінують усі інструменти ChatGPT і показують сильні результати в науці, коді та математиці. Також з’явився інструмент для розробників — Codex CLI.
Лише за кілька днів після анонсу GPT-4.1 компанія OpenAI представила ще два продукти — моделі o3 та o4-mini. За словами розробників, o3 — це найпотужніша модель для логічного мислення, яку вони створювали. Вона демонструє високі результати в галузях програмування, математики та науки. Своєю чергою, o4-mini — це доступніший за ціною варіант, що зберігає вражаючу ефективність.
Головна новинка полягає в тому, що ці моделі поєднують всі інструменти ChatGPT — включно з генерацією зображень і вебпереглядом. Це дозволяє розв’язувати складні багатокрокові задачі, а також наблизитися до автономної роботи.
o3 та o4-mini не лише бачать зображення — вони їх інтерпретують і “мислять” через них. Користувачі можуть завантажити фотографії дошок, діаграм або ескізів — навіть з поганою якістю — і моделі зможуть їх зрозуміти. Зображення стають частиною процесу розуміння: моделі вміють змінювати їх, аналізувати й будувати на їх основі логіку.
OpenAI заявляє, що поєднання інструментів і передового мислення підіймає якість рішень на новий рівень, як в академічних задачах, так і в реальному використанні.
Окрім моделей, компанія представила Codex CLI — новий інтерфейс для розробників, який дозволяє поєднувати локальний код з можливостями моделей OpenAI. Наразі він працює з o3 та o4-mini, пізніше отримає підтримку GPT-4.1.
Це все відбувається на фоні зміни стратегії OpenAI. Ще у лютому генеральний директор Сем Альтман говорив, що модель o3 не з’явиться як окремий продукт. Але на початку квітня він оголосив про «зміну планів» і пообіцяв випуск не лише o3, а й версії o3-pro — ще потужнішого варіанту для підписників Pro.
Альтман пояснив це тим, що розробка GPT-5 просувається краще, ніж очікувалося, а також зізнався, що інтеграція всіх функцій виявилася складнішою, ніж планувалося.
