ABBYY FineReader (Эбби Файн Ридер) – это одно из самых популярных приложений для сканирования и распознавания текста. На сегодняшний день, приложение работает с более чем 190 языками. Используемые программой алгоритмы распознавания отсканированного документа позволяют не только определить сам текст, но и исключить из него все остальное, в случае работы с некачественным исходным материалом (если страница будет старой и помятой, то лишние черточки, царапины и пятна не помешают выделить только буквы, цифры и знаки препинания).
Как это работает?
Основой для работы данного софта служит запатентованная технология ABBYY OCR (собственная разработка компании), которая способна выделить на графическом изображении буквы и символы. Программа позволяет работать не только с отсканированными документами, но и просто с изображениями, на которых необходимо распознать текст.
После того, как графическая информация будет детально изучена, а все символы будут найдены, в дело вступает технология поэтапного преобразования символов в связанные текстовые блоки:
- на основании характерных признаков выделяется разновидность письменности (кириллица, латиница, вязь, иероглифы и прочее);
- весь текст объединяется в один блок или делится на фрагменты (в зависимости от того, написан ли исходный материал на одном языке, или на разных);
- далее, участок текста, имеющий признак одного языка делится на отдельные слова (при помощи пробелов) и из него выделяются морфемы, которые и позволяют распознать язык;
- на последнем этапе ФайнРидер выбирает ближайшие аналоги слов из своей базы и составляет из них цифровую копию текста.
Базы данных с различными языками имеют достаточно большой размер, их покупку можно произвести отдельно.
Скачать Файн Ридер
Интерфейс утилиты достаточно прост и понятен. После запуска пользователю будет предложено выбрать необходимую операцию (отсканировать, распознать, создать новый документ и прочее). Выбрав необходимый пункт, для дальнейших действий будут даны соответствующие подсказки.
Помимо сканирования и распознавания документов, данный софт может создавать и редактировать документы во множестве различных форматов, включая PDF и DJVU. После оцифровки документа, некоторая часть ошибок может остаться. Чтобы облегчить работу пользователя, утилита оснащается функцией автоматической замены слов, чтобы ей воспользоваться достаточно навести курсор на слово, нажать левую кнопку мыши и выбрать правильный вариант.
Приложение платное, но имеется пробная версия для ознакомления с возможностями с функционала.