Google DeepMind представила SIMA 2: ШІ-агент для міркування у віртуальних світах
- Google DeepMind представила SIMA 2 — нове покоління універсального ШІ-агента, що інтегрований з моделлю Gemini 2.5 Flash-lite.
- SIMA 2 подвоїв продуктивність порівняно з SIMA 1 і може виконувати складні завдання в раніше небачених віртуальних світах.
- Агент має функцію самоудосконалення: він генерує власні завдання та навчається на своїх помилках, використовуючи Gemini для оцінки.
- SIMA 2 є «втіленим агентом», що розуміє емодзі та може мислити про свої цілі, що є кроком до AGI та робототехніки.
Google DeepMind представила дослідницьку версію SIMA 2 — наступного покоління свого універсального ШІ-агента. Завдяки інтеграції моделі Gemini 2.5 Flash-lite, SIMA 2 вийшов за рамки простого виконання інструкцій і тепер може розуміти та взаємодіяти з віртуальним середовищем, як людина.
SIMA 2 знаменує собою значний крок вперед порівняно з попередником, SIMA 1, який був представлений у березні 2024 року і мав лише 31% успіху у виконанні складних завдань. Інтеграція Gemini дозволила подвоїти продуктивність агента.

За словами старшого наукового співробітника DeepMind Джо Маріно, SIMA 2 є більш універсальним агентом, здатним виконувати складні завдання в раніше небачених середовищах. Це важливий крок до створення загального штучного інтелекту (AGI).
SIMA 2 може самостійно навчатися, використовуючи власний досвід, що є революційним підходом. Агент використовує іншу модель Gemini для генерації нових завдань та окрему модель для оцінки своїх спроб, таким чином, навчаючись на власних помилках без втручання людини.

Старший науковий співробітник DeepMind Джейн Ванг підкреслила, що SIMA 2 тепер може не лише виконувати дії, а й розуміти, що відбувається, мислити та реагувати зі здоровим глуздом.
SIMA 2 є так званим «втіленим агентом» (embodied agent), який взаємодіє з віртуальним світом через спостереження та дії, подібно до людини чи фізичного робота.
На презентації Маріно продемонстрував можливості SIMA 2 у грі «No Man’s Sky», де агент описав своє оточення та визначив подальші дії після взаємодії з маяком лиха. В іншій грі, коли агента попросили підійти до будинку кольору стиглого помідора, він внутрішньо провів логічне міркування: «Стиглі помідори червоні, отже, я повинен підійти до червоного будинку».

Завдяки Gemini, SIMA 2 також розуміє інструкції, передані за допомогою емодзі.
Дослідники DeepMind бачать SIMA 2 як ключовий елемент для розблокування можливостей універсальних роботів у реальному світі. SIMA 2 фокусується на поведінці високого рівня — розумінні мети, плануванні дій та міркуванні.
