adblock check

Поиск своей фамилии в старейших документах: Яндекс научился расшифровывать рукописные архивы

Новый сервис будет полезен как специалистам различных областей, так или иначе связанных с историей, так и обычным людям

Яндекс запустил новый сервис «Поиск по архивам», в основе которого лежат старые архивы (более чем 2,5 млн страниц исторических документов) с текстовой расшифровкой, сделанной нейросетями. Это стало возможным благодаря технологии, базирующейся на оптическом распознавании символов, — она учитывает особенности почерка, узнаёт переставшие использоваться буквы и понимает особую структуру архивных документов.

Нейросети обучались на сотнях тысяч реальных рукописных документов, датируемых 18 и 19 веками, а также на десятках миллионов сгенерированных образцов. Всё это контролировалось экспертами.

«Для расшифровки одной страницы архивного рукописного текста профессионалу может потребоваться до получаса времени, а наш сервис справляется с этим за несколько секунд, — говорит руководитель Поиска Яндекса Елена Бубнова. — В перспективе технологию можно использовать и для решения других задач в продуктах Яндекса».

«Поиск по архивам» создан не ради демонстрации технологий, а для реальной помощи людям: сервис окажется полезным историкам, социологам, демографам, генеалогам и даже обычным людям, ищущим информацию о своей семье. Сервис позволяет быстро находить документы с нужным ключевым словом, будь то имя, название города или что угодно другое.

На данный момент каталог сайта базируется на Главархиве Москвы, а также на архивах Оренбургской и Новгородской областей. В будущем база данных будет расширяться.

BoobyBoo85 BoobyBoo85
Без вести проспавший
1 комментарий
Оставьте комментарий...
Оставьте комментарий...
Maskim 1 год
Молодцы!!! Горжусь!!! А енти ваши гуглы так могут? Нет! То-то и оно. Показали кто главный в мире! Только надеюсь секретные архивы не начнут изучать а то либерахи сразу завоют о советских расстрелах и ГУЛАГах…