Технология распознавания аудиосообщений ВКонтакте вызвала рост обмена голосовыми

Фото аватара
Алексей Авдеев 27 ноября 2020 в 12:51

ВКонтакте усовершенствовала технологию распознавания голосовых сообщений. Теперь всего за секунду можно расшифровать записи продолжительностью до двух минут — это 99% всех аудио, которые отправляют пользователи. А в тех случаях, когда хочется рассказать длинную историю, можно записать голосовое длительностью до часа.

Голосовые сообщения продолжают оставаться самым популярным типом вложений в мессенджере ВКонтакте, обгоняя, например, фотографии и файлы. VK запустила технологию распознавания в июне. С этого момента аудитория, которая пользуется голосовыми, выросла на 10% — сейчас она составляет 33 миллиона человек в месяц. В среднем каждый пользователь сервиса читает 8 расшифровок в день.

Технология распознавания аудиосообщений — собственная разработка Команды ВКонтакте. Чтобы переводить в текст более продолжительные записи, не жертвуя скоростью, разработчики нашли новое технологическое решение. Алгоритмы автоматически разбивают длинное аудио на короткие блоки, расшифровывают их все одновременно, а затем объединяют обратно в одно сообщение. При этом они умеют разделять запись, не разбивая слова на части, чтобы не искажать смысл сказанного, — для этого используется технология Voice Activity Detection. На распознавание сообщения уходит около секунды.

Распознавание голосовых сообщений полностью автоматизировано. Для обучения нейросетей используются аудио, которые специально для этой задачи записывают участники программы VK Testers.

👍 Успей принять участие в розыгрыше! Все подробности в нашем Телеграм-канале!

Источник:
Подписаться
Уведомить о
0 Комментариев
Межтекстовые Отзывы
Посмотреть все комментарии

Сейчас на главной