OpenAI готує до запуску ШІ-агент Operator, який зможе за вас виконувати різні завдання на комп’ютері
OpenAI може незабаром представити інноваційний інструмент під назвою Operator, здатний самостійно керувати комп’ютером користувача і виконувати завдання. Про це пише TechCrunch.
Operator — це «агентна» система, яка може автономно виконувати різні завдання, включно з написанням коду чи бронюванням подорожей. Інформацію про цей продукт вперше опублікували Bloomberg та інші видання. За даними джерел, OpenAI планує презентувати Operator у січні.
Підтвердженням цієї інформації стали свідчення розробника ПЗ Тібора Блахо, який раніше неодноразово точно передавав дані про майбутні продукти у сфері штучного інтелекту.
Тібор Блахо виявив приховані функції у клієнті ChatGPT для macOS, серед яких є налаштування для «перемикання Operator» та «примусового завершення Operator». Окрім цього, OpenAI, за його словами, вже має на своєму сайті згадки про Operator, які поки що недоступні для широкого загалу.
Confirmed – the ChatGPT macOS desktop app has hidden options to define shortcuts for the desktop launcher to "Toggle Operator" and "Force Quit Operator" https://t.co/rSFobi4iPN pic.twitter.com/j19YSlexAS
— Tibor Blaho (@btibor91) January 19, 2025
Також у витоках фігурують таблиці з порівнянням продуктивності Operator із конкурентними ШІ-системами. Якщо дані правдиві, Operator демонструє результати нижчі за людські, але перевершує інших агентів у певних завданнях.
OpenAI website already has references to Operator/OpenAI CUA (Computer Use Agent) – "Operator System Card Table", "Operator Research Eval Table" and "Operator Refusal Rate Table"
— Tibor Blaho (@btibor91) January 20, 2025
Including comparison to Claude 3.5 Sonnet Computer use, Google Mariner, etc.
(preview of tables… pic.twitter.com/OOBgC3ddkU
На OSWorld, платформі для моделювання реального середовища роботи комп’ютера, ШІ-модель OpenAI CUA (імовірно основа Operator) набрала 38,1%. Це більше, ніж у конкурента Anthropic, але суттєво менше, ніж у людей (72,4%).
На тесті WebVoyager, який оцінює здатність ШІ працювати з вебсайтами, OpenAI CUA перевершила людські результати, але не змогла досягти рівня людей на іншому вебтесті — WebArena.
Система також показала низькі результати у завданнях, які люди виконують легко. Наприклад, створення криптогаманця вдалось Operator лише у 10% випадків, а запуск віртуальної машини — у 60%.
OpenAI витратила значний час на розробку Operator, приділяючи особливу увагу тестам на безпеку. Відомо, що система успішно проходить тести на стійкість до «зловмисних дій» і пошуку конфіденційних даних.
Конкуренти, такі як Anthropic і Google, також активно працюють у цьому напрямі. Водночас співзасновник OpenAI Войцех Заремба розкритикував Anthropic за нібито недостатню увагу до безпеки своїх агентів.
Технології ШІ-агентів мають великий потенціал і можуть стати революційними. За прогнозами Markets and Markets, до 2030 року цей ринок може досягти $47,1 мільярда.