В Яндекс Поиске появилась гибридная ИИ-архитектура для генеративных ответов | The GEEK

В Яндекс Поиске появилась гибридная ИИ-архитектура для генеративных ответов

Яндекс рассказал о новой гибридной архитектуре искусственного интеллекта для Поиска.
Фото аватара
Редакция The GEEK сегодня в 21:12
В Яндекс Поиске появилась гибридная ИИ-архитектура для генеративных ответов

Яндекс внедрил в Поиск гибридную архитектуру искусственного интеллекта, которая объединяет подходы Mixture of Experts и encoder-decoder. О разработке на конференции «День Поиска 2026» рассказала технический директор Яндекс Поиска Екатерина Серажим.

В компании пояснили, что такая схема нужна для задач, где модель должна быстро обрабатывать большой объём веб-документов и при этом укладываться в жёсткие требования по скорости и стоимости. Для этого Яндекс развивает отдельное семейство моделей Alice AI Search, заточенное именно под поисковые сценарии.

По словам Серажим, архитектура encoder-decoder лучше подходит для работы с большими массивами данных, поскольку одна часть модели анализирует запрос и документы, а другая формирует ответ. Для ускорения работы в Яндексе добавили слои MoE, которые позволяют задействовать только часть модели при генерации каждого следующего токена.

В компании утверждают, что совокупность изменений, включая новую архитектуру, помогла снизить стоимость инференса в три раза. На этом фоне покрытие ИИ-ответами в Поиске за год выросло в полтора раза.

В Яндексе также подчеркнули, что речь идёт о переносе подходов, которые раньше чаще встречались в научных исследованиях, в промышленный поиск с его требованиями к стабильности, скорости и нагрузке.