Яндекс обучила свои нейросети расшифровывать архивные записи со сложной дореволюционной орфографией. При этом опробовать технологию можно уже сейчас в сервисе «Поиск по архивам». Сейчас в нём находится более 2,5 млн страниц с историческими документами.
За основу алгоритма была взята система оптического распознавания символов. Она учитывает особенности почерка, распознаёт утратившие актуальность буквы и способна понимать структуру архивных документов.
В Яндексе считают, что сервис «Поиск по архивам» поможет повысить эффективность в работе историков, социологов, демографов, генеалогов и поможет тем, кто ищет сведения о своей семье. Со временем количество хранилищ и доступных отсканированных файлов будет увеличиваться.
💙 Обязательно подпишись: The GEEK в Телеграм
Комментарии