adblock check

Mistral представила OCR 4: мощный инструмент для извлечения текста на 170 языках мира

Разработчики сделали акцент в том числе на сегментации текстового контента. Новая модель умеет распознавать заголовки, таблицы и многое другое

Вчера, 23 июня, компания Mistral AI официально представила миру OCR 4 — новую модель, отвечающую за точное извлечение текстового контента. Представители бренда рассказали, что их новая разработка может похвастаться рядом преимуществ, которых нет у конкурирующих систем. Начать стоит с того, что эту модель можно запускать в том числе на собственной инфраструктуре, так как OCR 4 является достаточно компактным решением для развёртывания в рамках одного контейнера. Это, по словам компании, позволяет обеспечить необходимую конфиденциальность данных и высокую производительность пакетной обработки данных.

Второе важное преимущество новой модели — поддержка 170 языков в 10 языковых группах. Представители компании заявили, что они заметно улучшили распознавание и извлечение текста для специализированных языков и языков, представленных с ограниченными ресурсами. В данном направлении конкурирующие решения, по данным Mistral AI, демонстрируют заметное снижение производительности. Третьим же важным преимуществом новой модели выступает продвинутая сегментация текстового контента. Суть в том, что OCR 4 умеет не только извлекать текст, но и классифицировать контент по типизированным блокам.

Изображения: Mistral AI

То есть система умеет распознавать заголовки, таблицы, уравнения, различные подписи и многое другое, что положительно сказывается на финальном качестве извлечённого контента. Всё это позволило новой модели продемонстрировать очень высокую точность работы — в бенчмарке OlmOCRBench система демонстрирует 85% точности, а в Crawl Multilingual модель набирает 98%. Это впечатляющий результат, особенно с учётом того, что некоторые довольно мощные конкуренты набирают заметно меньше.

Mistral представила OCR 4: мощный инструмент для извлечения текста на 170 языках мира
Изображение: Mistral AI

Более того, независимые тесты показывают, что пользователи в рамках слепых тестов обычно отдают предпочтение именно OCR 4. Весьма примечательно, что в этом плане модель заметно обходит лидеров рынка — GPT 5.5 Pro, Gemini 3.1 Pro Preview, Azure Doc Intel и AWS Textract.

Mistral представила OCR 4: мощный инструмент для извлечения текста на 170 языках мира
Изображение: Mistral AI

При этом, что немаловажно для конечного пользователя, новую модель можно назвать относительно недорогой по современным меркам. На официальном сайте компании указано, что в режиме OCR за 1000 страниц извлечённого текста придётся заплатить всего 4 доллара. Если модель в реальных сценариях работы демонстрирует ту точность, которая показана на графиках, это очень даже недорого.

Источник

ИИ ИИ
17,1K участников
Вступить
1 комментарий
Оставьте комментарий...
Оставьте комментарий...
daniilsolovjeva
Ого цена супер