Яндекс разработал ультрамалую нейросеть для голосовой активации в носимых устройствах. Размер модели ужали примерно до 200 КБ — меньше, чем весит одна фотография в галерее смартфона. Об этом рассказал Дмитрий Солодуха, руководитель направления голосовой активации в Яндексе.
Наушники и часы жёстко ограничены по батарее, памяти и мощности процессора, а система активации обязана непрерывно слушать звук и локально ждать команду. Решение — двухэтапная обработка: сначала лёгкая модель определяет, есть ли в потоке речь, и почти не нагружает устройство, и только потом подключается основная и проверяет ключевую команду.
Число параметров основной модели сократили примерно в 10 раз за счёт более компактной архитектуры, без заметной потери качества распознавания. Это позволяет обрабатывать команды локально, без постоянной передачи аудио в облако: ниже энергопотребление и меньше задержка. Дополнительно модель может работать на чипах с NPU, который выполняет такие вычисления экономичнее CPU.

Любопытная деталь: первым носимым устройством Яндекса стали ИИ-наушники Дропс с Алисой, продажи которых должны стартовать в ближайшее время. При этом среди сценариев для новой модели компания прямо упоминает умные часы. Так что следующий шаг после Дропс может оказаться вполне предсказуемым: Яндекс покажет собственное носимое устройство в формате часов. По крайней мере, технологическая база для такого продукта, судя по всему, уже есть.





































