Наверное, большая часть из нас, хотела бы иметь дар чтения по губам. Однако, это доступно не всем, а вот у нейронных сетей, созданных на базе ИИ, уже получается читать не только отдельные слова, но и предложения.
Первым это удалось сделать представителям Оксфордского университета, которые воспользовались способностями ИИ DeepMind, разработанного в Google. Созданная кибермашина LipNet, способна с точностью до 93% воспроизводить предложения путём чтения по губам. Это на 14% лучше, чем более ранние разработки. Если сравнивать с человеком, способным читать по губам, то у него этот показатель не превышает 53%.
Главным достижением системы считается возможность анализа не одного конкретного слова, как это делалось ранее, а предложения целиком. Именно это позволило машинному распознаванию текста приблизиться к 100%. Создатели LipNet считают, что со временем, нейронная сеть будет “умнеть“ и сможет наиболее точно предсказать слова в предложении. Что касается области применение подобного алгоритма чтения, то здесь сразу на ум приходят люди с проблемами со слухом. В цифровом мире подобная разработка поможет добиться положительных результатов при работе с цифровым помощником.