Google випускає Gemini Robotics On-Device: ШІ-модель для автономних роботів

25 Червня, 2025 Vitaliy Kairov DeepMind, Gemini, Google, ШІ342 переглядів 2 хв. читання

Google DeepMind випустила нову мовну модель Gemini Robotics On-Device, яка може керувати роботами локально, без підключення до інтернету.
Модель демонструє продуктивність, близьку до хмарної версії, та перевершує інші локальні рішення.
Вона дозволяє роботам виконувати складні завдання, як-от розстібання сумок та складання одягу, та адаптована для ALOHA-роботів, Franka FR3 та гуманоїдного робота Apollo.
Google також випускає Gemini Robotics SDK для розробників, що дозволяє навчати роботів новим завданням з 50–100 демонстрацій.
Інші компанії, такі як Nvidia, Hugging Face та RLWRLD, також активно розвивають напрямок ШІ в робототехніці.

Google DeepMind у вівторок анонсувала нову мовну модель під назвою Gemini Robotics On-Device, яка дозволяє роботам виконувати завдання локально, без постійного підключення до інтернету. Це значний крок у розвитку автономної робототехніки.

Модель Gemini Robotics On-Device, що є продовженням попередньої моделі Gemini Robotics, випущеної в березні, здатна контролювати рухи робота. Розробники можуть керувати та тонко налаштовувати модель за допомогою підказок природною мовою, адаптуючи її під різноманітні потреби.

Google стверджує, що в тестах нова модель демонструє продуктивність, близьку до хмарної версії Gemini Robotics, а також перевершує інші локальні моделі (хоча конкретні назви конкурентів не називаються).

На демонстрації було показано, як роботи, що працюють на цій локальній моделі, виконують такі завдання, як розстібання сумок та складання одягу. Спочатку модель навчалася для ALOHA-роботів, але пізніше була адаптована для роботи з дворучним роботом Franka FR3 та гуманоїдним роботом Apollo від Apptronik. Google заявляє, що Franka FR3 успішно справлявся зі сценаріями та об’єктами, які раніше не “бачив”, наприклад, виконуючи збірку на промисловій стрічці.

Google DeepMind також випускає Gemini Robotics SDK. Компанія повідомила, що розробники зможуть навчати роботів новим завданням, демонструючи їм 50-100 прикладів, використовуючи ці моделі в фізичному симуляторі MuJoCo.

Інші розробники ШІ-моделей також активно інвестують у робототехніку. Nvidia створює платформу для розробки фундаментальних моделей для гуманоїдів; Hugging Face розробляє відкриті моделі та набори даних для робототехніки, а також працює над самими роботами; а південнокорейський стартап RLWRLD, підтримуваний Mirae Asset, працює над створенням фундаментальних моделей для роботів. Це підкреслює зростаючий інтерес та конкуренцію у сфері інтеграції ШІ та робототехніки.

Vitaliy Kairov

Залишити відповідь Скасувати коментар