Google випустила Gemini Robotics-ER 1.6 — модель, що покращила просторове мислення роботів
- Google представила Gemini Robotics-ER 1.6 — модель для робототехніки з покращеним просторовим мисленням і розумінням оточення.
- Модель самостійно визначає момент завершення завдання і вирішує — повторити дію чи перейти далі.
- Нова функція зчитування інструментів дозволяє роботам розпізнавати вимірювальні прилади — показано на Boston Dynamics.
- Gemini Robotics-ER 1.6 названо найзахищенішою робототехнічною моделлю Google.
Google представила Gemini Robotics-ER 1.6 — оновлену модель для робототехніки, орієнтовану на просторове мислення та розуміння оточення. Модель спеціалізується на візуальному та просторовому розумінні, плануванні завдань і визначенні успішного виконання.
Визначення моменту завершення завдання Google називає ключовим елементом автономності: система має самостійно вирішувати — повторити невдалу дію чи перейти до наступного етапу плану. Gemini Robotics-ER 1.6 працює як високорівнева модель мислення для роботів і може звертатися до різних інструментів: пошуку Google, моделей зору, мови та дії, а також сторонніх функцій, визначених користувачем.
За показниками просторового й фізичного мислення — зокрема у навичках вказування, підрахунку та визначення успішного виконання — модель суттєво перевершує попередні версії Gemini Robotics-ER 1.5 та Gemini 3.0 Flash.
Окремо представлена нова функція зчитування інструментів, яка дозволяє роботам розпізнавати складні вимірювальні прилади та оглядові елементи. Демонстрацію показали на прикладі робота Boston Dynamics. Google також зазначає, що Gemini Robotics-ER 1.6 є найзахищенішою робототехнічною моделлю компанії: вона краще дотримується політик безпеки Gemini та враховує фізичні обмеження безпеки.
