Компания Google представила Gemini Robotics ER-1.6 — усовершенствованную версию модели, предназначенную для физических агентов следующего поколения. Новинка ориентирована на глубокое понимание физического мира и решение задач с высокой точностью. Основные улучшения коснулись пространственной логики и способности анализировать окружение с разных ракурсов. Модель специализируется на критически важных для робототехники функциях, таких как визуальное планирование задач и автоматическое определение успешности их выполнения, что существенно повышает автономность систем.
Одной из ключевых возможностей стала функция считывания показаний приборов. Благодаря сотрудничеству с Boston Dynamics, новинка научилась распознавать данные со сложных измерительных инструментов, аналоговых датчиков и смотровых стекол. Модель эффективно объединяет информацию с нескольких камер, чтобы точно оценивать состояние среды и принимать логические решения. Кроме того, Gemini Robotics ER-1.6 названа самой безопасной в линейке: она демонстрирует высокую дисциплину в соблюдении правил безопасности даже при работе в сложных условиях, требующих быстрого пространственного мышления.
Модель уже доступна для разработчиков через API Gemini и платформу Google AI Studio. Это позволяет интегрировать возможности продвинутого планирования в различные роботизированные системы — от промышленных манипуляторов до мобильных платформ. Использование новинки в качестве «высокоуровневого мозга» помогает распределять сложные задачи на подэтапы и самостоятельно корректировать действия в случае ошибок. Доступ к такому инструменту открывает перспективы для создания физических агентов, способных к естественному взаимодействию с окружающим пространством без постоянного контроля со стороны человека.
