Если у вас изредка возникает необходимость распознать текст из картинок или файлов PDF, то вы знаете, что это не так уж и просто. Нет, с технической частью все в порядке — современное программное обеспечение с успехом справляется с этой задачей. Проблема в том, что бесплатное ПО в этой области практически отсутствует, а коммерческие системы довольно дороги. На выручку могли бы прийти онлайновые сервисы, но у многих из них весьма ограниченные возможности и драконовские ограничения. Однако, не все так плохо и имеются все же приятное исключение.2010-12-01 18h02_31

Сервис OCROnline позволяет бесплатно распознавать текст из изображений JPG, PNG, GIF, TIFF и файлов в формате PDF. Файлы должны быть не более 10 Мб и содержать не более 100 страниц. Поддерживается более 150 языков. На выходе вы можете получить файл в формате DOC, PDF, RTF или TXT.

Работа с сервисом очень проста и состоит всего из нескольких операций: указание языка и формата вывода, загрузка исходного документа, обработка и сохранение результата. При тестировании OCROnline показал весьма приличные результаты распознавания и даже сохранил форматирования в довольно сложном документе.

2010-12-01 18h23_08

К достоинствам сервиса можно отнести прежде всего бесплатность, не плохое качество распознавания и скорость работы. Недостатком является то, что нельзя добавить более одного языка распознавания, поэтому если ваш документ содержит слова на иностранном языке, то результаты будут не удовлетворительными.

Разумеется, данный сервис нельзя рекомендовать для серьезных OCR-работ, но как палочка-выручалочка при разовой необходимости вполне сгодится, поэтому однозначно заслуживает место в закладках. На всякий случай.

Попробовать OCROnline