Яндекс создаёт Physical AI: роботы начнут видеть, слышать и действовать как люди

Яндекс начал применять физический искусственный интеллект, чтобы научить роботов и автономные автомобили лучше понимать окружающий мир.
Валентин Снежин сегодня в 11:40

Компания Яндекс объявила о разработке Physical AI — физического искусственного интеллекта, который сможет воспринимать окружающий мир, понимать контекст и адаптироваться к изменениям среды. Технологии станут основой для следующего поколения автономных систем, включая сервисных роботов, доставщиков и беспилотные автомобили.

Работы над Physical AI ведут команды Яндекс Роботикс и автономного транспорта. Первые создают универсальный «мозг» для промышленных и сервисных роботов, вторые — развивают технологии восприятия и планирования, используемые с 2017 года в беспилотных автомобилях и доставщиках Яндекса.

Что позволит физический ИИ:

  • объединять мультимодальные данные (видео, изображения, звук, текст) для восприятия мира, близкого к человеческому;
  • адаптироваться к устройствам разных типов — от роборуки до гуманоидного робота;
  • моделировать сценарии и принимать решения без участия человека.

Команда Яндекс Роботикс уже создала модель VLA (Vision-Language-Action), которая преобразует голосовые и текстовые команды в конкретные действия — например, «взять», «перенести» или «положить». В будущем таких команд станет сотни. Система Yandex RMS позволяет роботам координировать работу между собой и самостоятельно определять способ решения задач.

Пользователи смогут взаимодействовать с роботами естественным образом — голосом, жестами или через текст. По мнению компании, решение упростит внедрение роботизации в бизнес-процессы и избавит компании от необходимости обучать персонал программированию.

Автономные автомобили

Команда автономного транспорта развивает ML-планировщик, основанный на нейросетевом трансформере, обученном по примерам поведения профессиональных водителей. Он делает движение беспилотных автомобилей более плавным и предсказуемым.

Также компания развивает симулятор для отработки сложных и редких сценариев, повышая безопасность технологий.

В будущем Physical AI позволит беспилотникам не просто распознавать объекты, а воспринимать дорожные ситуации в динамике, учитывать сигналы светофоров и взаимодействовать с инфраструктурой. Гуманоидные роботы смогут оценивать вес предметов, сохранять равновесие и безопасно взаимодействовать с человеком.

