Команда «Яндекса» анонсировала новый проект «Поиск по архивам». В базе нового сервиса более 2,5 миллионов архивных рукописных документов за XVIII — XX века.
Что это такое
Новая модель была обучена на сотнях тысяч рукописных строк реальных архивных документов, датированных с XVIII по XIX век. Кроме того, нейросети также скормили миллионы примеров, которые были искусственно сгенерированы.
«Сервис Яндекса «Поиск по архивам» позволяет быстро находить имена, фамилии, названия населённых пунктов и любые другие слова в рукописных документах XVIII — начала XX века. Сейчас в базе более 2,5 миллионов архивных документов из хранилищ Москвы, Оренбурга и Великого Новгорода. Со временем количество фондов и источников будет увеличиваться» — сообщается в описании «Поиска по архивам»
Попробовать модель можно уже сейчас. Бесплатная технология доступна всем желающим на сайте проекта «Поиск по архивам».
Как работает «Поиск по архивам»
Модель построена на основе системы оптического распознавания символов. При этом нейросеть учитывает особенности почерка, узнает дореволюционные буквы и понимает специфическую структуру архивных документов.
«Сервис работает на базе технологии оптического распознавания текста Яндекса. Нейросети узнают утратившие актуальность символы, учитывают особенности почерка и за несколько секунд превращают непонятные неподготовленному человеку записи в печатный текст» — объясняют на сайте проекта.
Больше про Яндекс
Недавно «Яндекс» анонсировал интерактивную карту захода солнца, которая позволяет посмотреть часовой пояс и время суток в любой точке Земного шара. Запуск приурочили к Дню зимнего солнцестояния, который был в декабре 2022 года.
Ранее сервис для чтения книг «Букмейт» вошел в подписку «Яндекс.Плюс», после того, как ирландскую компанию «Bookmate» включили в реестр СМИ-иноагентов.