Яндекс разработал собственную отказоустойчивую платформу Agents Transport System (ATS). Теперь именно на ней будут создавать всех ИИ-агентов компании. Она позволяет агентам быстрее выполнять многошаговые задачи даже при потере соединения или закрытии приложения.
Если связь обрывается, агент не начинает процесс заново после её восстановления, а продолжает работу с того же шага. Это особенно важно для сложных сценариев, где требуется многократное обращение к моделям, инструментам и внешним сервисам.
Платформа уже применяется в ИИ-агенте «Исследовать» в Алиса AI. В рамках таких задач он может десятки раз взаимодействовать с различными компонентами. Без ATS любой сбой приводил бы к полному перезапуску процесса и увеличению времени ожидания для пользователя.
Через ATS проходит всё взаимодействие между агентами, инструментами и моделями. Платформа фиксирует текущее состояние выполнения задачи и при необходимости восстанавливает его с последней сохранённой точки. Пользователь при этом видит пошаговый прогресс: ответ формируется постепенно, без потери промежуточных результатов.
Для Яндекса внедрение ATS означает и снижение затрат. Поскольку при сбоях не требуется повторно отправлять одни и те же запросы к моделям, уменьшается нагрузка на вычислительные мощности и оптимизируются расходы.
Аналогичные внутренние решения существуют и у других крупных игроков рынка, включая OpenAI. Однако они используются исключительно внутри компаний. В случае с ATS команда Яндекса получила универсальную инфраструктурную платформу, позволяющую сосредоточиться на разработке самих ИИ-агентов.












































