Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Выгодные покупки
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
МакрадарТехнологии
3 декабря 2013

ABBYY FineReader Express 8.4: распознавание текста с любых источников на лету (раздача кодов завершена)

Фото автора Артём Козориз
Артём Козориз

Автор Лайфхакера

ABBYY FineReader Express 8.4: распознавание текста с любых источников на лету (раздача кодов завершена)

Цифровой контент и электронные версии документов окружают нас со всех сторон. Для бумаги в нашей жизни почти не осталось места. Газеты и журналы перешли в онлайн-формат, книги мы читаем на e‑ink ридерах или планшетах, обычные письма заменили email и sms. Но все же, иногда нам приходится сначала повозиться с бумажками, чтобы получить их электронную копию. Здесь нам на помощь приходят специальные программы, которые используют технологию оптического распознавания текста OCR (Optical Character Recognition). Самой известной из них, бесспорно является ABBYY

FineReader. С ее помощью можно преобразовать бумажные документы в редактируемые форматы и сохранить PDF с возможностью поиска по тексту. И сегодня у нас есть отличная возможность познакомиться с ней поближе. 

* * *

Для Mac’ов, ABBYY предлагает только FineReader Express, тем не менее она обладает необходимой функциональностью. Ключевыми особенностями ABBYY FineReader Express является точность распознавания и сохранение оформления, поддержка большого количества языков (171 язык, до трех языков в одном документе), преобразование и создание PDF (конвертация PDF в редактируемые форматы), редактор для ручной разметки областей (текст, таблица, картинка) и простой, удобный интерфейс программы.

Первый взгляд

Снимок экрана 2013-11-29 в 23.55.54

Рабочее окно FineReader Express довольно минималистично, здесь присутствуют только самые необходимые элементы. В боковой панели располагаются эскизы добавленных страниц, а на панели иснтрументов кнопки с выпадающими списками: для выбора языка и выходного файла. Еще есть кнопки конвертации и масштабирования. В остальном, интерфейс соответствует быстрой экспресс-версии, в которой сделана ставка на автоматическое выполнение операций, с минимумом настроек и участия пользователя.

Переходим к испытаниям

Снимок экрана 2013-11-29 в 19.06.38

После запуска FineReader встречает нас компактным окошком с выбором сценария. Здесь нам предлагается выбрать источник захвата: сканер, факс или чтение из файла. Также рекомендуется указать язык документа (или языки, если их несколько) — это поможет улучшить точность распознавания исходного документа. Ну и собственно формат выходного файла, здесь все просто — выбираем, исходя из типа бумажного документа.

Сканера под рукой у меня не оказалось, но это даже к лучшему — используя в качестве источника фото сделаные с помощью iPhone, я усложнил задачу по распознаванию текста. В качестве примера текста я взял одну из книжек своей супруги, а в качестве примера таблицы — какую-то старую рабочую накладную из фотопленки айфона. Что ж, давайте приступим.

Распознаем страницу с текстом

За неимением сканера я просто сделал фото разворота книги — обычное фото при комнатном освещении, никаких штативов и прочих ухищрений. Вот оригинал:

фото 2-ц1

Посмотрим, что с ним сможет сделать FineReader. Указываем, что хотим вытащить из фото текст, определяем язык как русский и запускаем процесс.

Снимок экрана 2013-11-29 в 20.35.20

К чести приложения нужно сказать, что определился весь текст, включая случайно попавший с изгиба соседней страницы. Кусок стола, который я специально оставил в кадре, ожидаемо определился как картинка. Но это не страшно, так как мы можем вручную изменить области определения, указать их тип (если программа определит неверно) и удалить области, распознавание которых не требуется. Все манипуляции заняли у меня меньше минуты, а в итоге я получил вот такой, вполне приемлемый результат:

Снимок экрана 2013-11-29 в 19.36.52

После небольшой вычитки и правки документ готов. Я считаю, что это достойный результат для такого быстрого, почти автоматического процесса распознавания.

Распознаем таблицу

фото 1-1

В качестве подопытной таблицы выступает простенькая накладная, которая тоже была снята на айфон. Здесь уже используется украинский (заодно и проверим поддержку языков), что тоже полезно для нашего опыта. Выбираем новый сценарий (⌘N) указываем источник — чтение из файла, язык — украинский и файл на выходе — таблица.

Программа задумывается на несколько секунд и вот перед нами результат:

Снимок экрана 2013-11-29 в 23.49.09

С таблицей программа справилась не так хорошо, но в принципе определение текста более-менее сносное, разве что почему дорисовались ячейки, которых не было в исходном документе. Тут придется повозиться немножко дольше, чтобы добиться финального вида отображения документа, но все же это проще чем набирать табличку с вручную с нуля.

Сохранение в PDF

Снимок экрана 2013-11-29 в 22.21.51

При сохранении в PDF, к сожалению программа никак не улучшает исходное изображение (контраст, яркость) и оно помещается в PDF-документ как есть. Но тем менее, поиск по тексту присутствует, а это уже хорошо.

Итог

Как и любой инструмент, FineReader имеет свои плюсы и минусы. К сильным сторонам, помимо заявленных производителем характеристик, является то, что распознавание текста и таблиц работает достаточно неплохо, а конвертирование в PDF, как и обещано, поддерживает поиск по тексту. Минусом можно считать отсутствие настроек и очень скудные возможности по ручному управлению процессом. Но это отчасти оправдывается, тем что это экспресс-версия и работает она в автоматическом режиме.

Коды для программы FineReader Express выиграли Григорий Ушаров и Николай Блинов. Поздравляем! Проверяйте личные сообщения, коды отправлены.

Приложение не найдено
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

Хитовый видеорегистратор 2025 года от 70mai отдают со скидкой 59%

Хитовый видеорегистратор 2025 года от 70mai отдают со скидкой 59%

Надо брать: Honor 400 Lite с 12 ГБ ОЗУ и экраном 120 Гц дешевле 15 000 рублей

Надо брать: Honor 400 Lite с 12 ГБ ОЗУ и экраном 120 Гц дешевле 15 000 рублей

Что подарить ребёнку? 10 идей для детей от 0 до 10 лет

Что подарить ребёнку? 10 идей для детей от 0 до 10 лет

15 удобных кроссовок со скидками до 68% на распродаже 11.11

15 удобных кроссовок со скидками до 68% на распродаже 11.11

робот пылесос tuvio

Робот-пылесос Tuvio купили 5 тысяч раз. Сейчас его отдают со скидкой 65%

Надо брать: утеплённые кроссовки от Golden Camel со скидкой 59%

В этих кроссовках можно долго гулять зимой без страха поскользнуться

Надо брать: пауэрбанк Baseus на 145 Вт с выдвижным проводом и скидкой 56%

Надо брать: пауэрбанк Baseus на 145 Вт с выдвижным проводом и скидкой 56%

Самый популярный рюкзак от Tigernu отдают со скидкой 62%

Самый популярный рюкзак от Tigernu подешевел в два раза на распродаже AliExpress

Это интересно
Ребёнок в машине: 6 главных ошибок, которые допускают родители

Ребёнок в машине: 6 главных ошибок, которые допускают родители

Коля идёт на смену! Как проходит первый день новичка на складе Ozon 

Коля идёт на смену! Как проходит первый день новичка на складе Ozon 

7 мифов о распродажах на маркетплейсах, из‑за которых продавцы теряют прибыль: разбираемся с Ozon

7 мифов о распродажах на маркетплейсах, из‑за которых продавцы теряют прибыль: разбираемся с Ozon

Реклама
Подождать, но сэкономить: в России заработал маркетплейс SuperCheap. Что о нём нужно знать

Подождать, но сэкономить: в России заработал маркетплейс SuperCheap. Что о нём нужно знать

Реклама
Комментарии
sleepwater
03.12.13 13:26
https://twitter.com/sleepwater/status/407787395497869312
Григорий Ушаров
03.12.13 13:31
https://www.facebook.com/g.usharoff/posts/623832654339894
Виталий Семенов
03.12.13 13:34
https://twitter.com/v_semenov/status/407789447313244160
Alex Crane
03.12.13 13:35
https://twitter.com/CraneMJAC/status/407789948427718656
x-chel
03.12.13 14:15
https://twitter.com/edblazhnov/status/407800258559610880
Вячеслав Зайцев
03.12.13 14:36
https://twitter.com/Zaitsev_Slava/status/407804322701778944
Владимир Гончаров
03.12.13 15:05
http://vk.com/samolyotikov?w=wall6264410_461%2Fall
Владимир Гончаров
03.12.13 15:05
http://vk.com/samolyotikov?w=wall6264410_461%2Fall
Alex Delun
03.12.13 15:20
https://twitter.com/b0u5/status/407815872271511552
Владимир Пыженков
03.12.13 15:22
https://twitter.com/Smartman_ru/status/407816931153293313
scotch1692
03.12.13 15:33
https://twitter.com/scotch1692/status/407819348481294336
Заманов
03.12.13 16:05
https://twitter.com/SurashBatyr/status/407825395765874688
Konstantin Garkavyy
03.12.13 16:21
https://twitter.com/iDesertus/status/407831866004103169
Sergey Smurov
03.12.13 16:32
https://www.facebook.com/sergey.smurov.9/posts/269155443231866
Elena Kozlova
03.12.13 16:52
https://www.facebook.com/ms.beauty.doctor/posts/10202779810279214
Nik McCoy
03.12.13 18:25
https://twitter.com/ierom/status/407862947940409344
gsadh
03.12.13 18:58
https://twitter.com/AndreiPoskonnyi/status/407870823148449792
Blinov Nikolay
03.12.13 20:00
https://twitter.com/The_west_coast/status/407886884447059968
Дмитрий Красильников
03.12.13 20:20
https://twitter.com/3loy11/status/407891892366348289
_Prokhorov_
03.12.13 22:11
https://twitter.com/_prokhorov_/status/407919515243393024
sandy
03.12.13 22:49
https://twitter.com/sandy_komaroff/status/407929403876728833
Bogdan Kalchuk
04.12.13 00:28
https://www.facebook.com/bogdan.kalchuk
Artem Frolov
04.12.13 01:59
http://vk.com/wall16072575_857
Semen Litvinov
04.12.13 13:09
https://twitter.com/litvinio/status/408145689625903105
Blinov Nikolay
04.12.13 13:32
спасибо)
Dmitriy
24.03.14 11:23
https://twitter.com/kepetol/status/407918485247778817
Dmitriy
24.03.14 11:23
https://twitter.com/kepetol/status/407918485247778817
Dmitriy
24.03.14 11:23
https://twitter.com/kepetol/status/407918485247778817
Григорий Ушаров
24.03.14 11:23
https://www.facebook.com/g.usharoff/posts/623832654339894 https://twitter.com/g_usharoff/status/407788466387177474 http://vk.com/wall8944372_1071
Григорий Ушаров
24.03.14 21:50
https://www.facebook.com/g.usharoff/posts/623832654339894 https://twitter.com/g_usharoff/status/407788466387177474 http://vk.com/wall8944372_1071
Что вы могли пропустить
DJI представила Neo 2 — дрон для новичков с голосовым и жестовым управлением
DJI представила Neo 2 — дрон для новичков с голосовым и жестовым управлением
0
Вчера
Новости
Устройства
Надо брать: Honor 400 Lite с 12 ГБ ОЗУ и экраном 120 Гц дешевле 15 000 рублей
Надо брать: Honor 400 Lite с 12 ГБ ОЗУ и экраном 120 Гц дешевле 15 000 рублей
0
Вчера
Покупки
Устройства
Google не будет полностью ограничивать установку приложений из сторонних источников
Google не будет полностью ограничивать установку приложений из сторонних источников
0
Вчера
Android
Новости
Как правильно перезагружать роутер и зачем это делать
Как правильно перезагружать роутер и зачем это делать
0
Вчера
Ликбез
Технологии
Apple добавила в MacBook эффект кольцевой лампы для видеозвонков
Apple добавила в MacBook эффект кольцевой лампы для видеозвонков
0
Вчера
Новости
Технологии
Представлен бюджетный смартфон Nubia V80 Design с ИИ-кнопкой и дизайном как у iPhone 17 Pro Max
Представлен бюджетный смартфон Nubia V80 Design с ИИ-кнопкой и дизайном как у iPhone 17 Pro Max
0
Вчера
Новости
Устройства
Инсайдер раскрыл название, дату релиза и характеристики «трикладушки» Samsung
Инсайдер раскрыл название, дату релиза и характеристики «трикладушки» Samsung
0
Вчера
Новости
Устройства
Надо брать: пауэрбанк Baseus на 145 Вт с выдвижным проводом и скидкой 56%
Надо брать: пауэрбанк Baseus на 145 Вт с выдвижным проводом и скидкой 56%
0
Вчера
Покупки
Устройства
Раскрыт официальный дизайн Honor 500 и 500 Pro — они будут очень похожи на iPhone Air
Раскрыт официальный дизайн Honor 500 и 500 Pro — они будут очень похожи на iPhone Air
0
Вчера
Новости
Устройства
Valve представила гибрид консоли и ПК Steam Machine — а ещё новые VR-шлем и контроллер
Valve представила гибрид консоли и ПК Steam Machine — а ещё новые VR-шлем и контроллер
0
Вчера
Новости
Устройства
OpenAI представила GPT‑5.1 — более умную ИИ-модель с новыми пресетами личности
OpenAI представила GPT‑5.1 — более умную ИИ-модель с новыми пресетами личности
0
Вчера
Веб-сервисы
Новости
Надо брать: субфлагман Realme GT7 с аккумулятором 7 000 мА·ч и скидкой 64%
Надо брать: субфлагман Realme GT7 с аккумулятором 7 000 мА·ч и скидкой 64%
0
12 ноября
Покупки
Устройства
Названы 10 самых продаваемых смартфонов на «Чёрной пятнице» в Китае
Названы 10 самых продаваемых смартфонов на «Чёрной пятнице» в Китае
0
12 ноября
Новости
Устройства
Надо брать: компактный 8-дюймовый планшет Xiaomi Pad Mini со скидкой 43%
Надо брать: компактный 8-дюймовый планшет Xiaomi Pad Mini со скидкой 43%
0
12 ноября
Покупки
Устройства
Microsoft прекратила поддержку двух версий Windows 11
Microsoft прекратила поддержку двух версий Windows 11
0
12 ноября
Windows
Новости

Новые комментарии

Аватар автора комментария
Olga Gordeeva5 часов назад

0 / 0

А вилкой - то зачем протыкать?
Насыпной пирог с творогом
Аватар автора комментария
Olga Gordeeva5 часов назад

0 / 0

А с консервированными абрикосами можно приготовить?
Насыпной пирог с абрикосами
Аватар автора комментария
Zodiac Animalia6 часов назад

0 / 0

Одобрено 9 из 10 стоматологов
Знаете ли вы, зачем нам ногти?
Аватар автора комментария
Артём Козориз7 часов назад

0 / 0

Ну, мейнстрим-геймеры и геймеры-энтузиасты с 5090 — всё же разные категории людей, первых явно больше. И Valve это понимает. На пару лет хватит, а там можно и Pro-версию выпустить.
Valve представила гибрид консоли и ПК Steam Machine — а ещё новые VR-шлем и контроллер
Пазл жизни: что нужно знать о донорстве костного мозга

Пазл жизни: что нужно знать о донорстве костного мозга

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииДля начинающих авторов
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях