Яндекс запустил новый сервис «Поиск по архивам», в основе которого лежат старые архивы (более чем 2,5 млн страниц исторических документов) с текстовой расшифровкой, сделанной нейросетями. Это стало возможным благодаря технологии, базирующейся на оптическом распознавании символов, — она учитывает особенности почерка, узнаёт переставшие использоваться буквы и понимает особую структуру архивных документов.
Нейросети обучались на сотнях тысяч реальных рукописных документов, датируемых 18 и 19 веками, а также на десятках миллионов сгенерированных образцов. Всё это контролировалось экспертами.
«Для расшифровки одной страницы архивного рукописного текста профессионалу может потребоваться до получаса времени, а наш сервис справляется с этим за несколько секунд, — говорит руководитель Поиска Яндекса Елена Бубнова. — В перспективе технологию можно использовать и для решения других задач в продуктах Яндекса».
«Поиск по архивам» создан не ради демонстрации технологий, а для реальной помощи людям: сервис окажется полезным историкам, социологам, демографам, генеалогам и даже обычным людям, ищущим информацию о своей семье. Сервис позволяет быстро находить документы с нужным ключевым словом, будь то имя, название города или что угодно другое.
На данный момент каталог сайта базируется на Главархиве Москвы, а также на архивах Оренбургской и Новгородской областей. В будущем база данных будет расширяться.
- Можно управлять только голосом? Обзор Яндекс Телевизора 50" с Алисой
- Настоящий ИИ появится на 13 лет раньше — в 2029. По каким критериям его признают
- 2 часа ходил за роботом-доставщиком Яндекса и разобрался, как всё устроено. Это — будущее
- Алиса, Алекса и Маруся — неудачные имена голосовых ассистентов. Правильно поступил Google
- Браузерный «офис» от Яндекса, Google или Microsoft: детальное сравнение сервисов
Добавить комментарий
Если нужно ответить кому-то конкретно,
лучше нажать на «Ответить» под его комментарием