Google открыл API для оптического распознавания текстов

Да-да, их работы в Google Books наверняка принесли хорошие плоды, которые мы можем начинать пожинать. И сейчас я вам расскажу как.

Сканированные документы не всегда требуют превращения в реальный текст. Однако иногда так хочется не набирать какое-нибудь соглашение снова, а электронной копии-то и нет. Конечно, вы могли бы воспользоваться какой-нибудь дешевой программой OCR, идущей вместе со сканером, или даже купить (не воровали же вы) FineReader. Но время бесплатных настольных  OCR программ проходит еще и потому, что сейчас тексты все чаще фотографируют, а не сканируют.

Для загрузки любых картинок (jpeg, png, gif) с текстом для последующего распознавания Google и открыл API в Google Docs. Теперь вы можете загружать картинки в библиотеку документов, а сервера Google превратят ее в текст.

Существует и приложение пример, иллюстрирующее работу API:

Но вам, программисты, следует подумать о создании своих интерфейсов к этим возможностям. Например — у вас есть сканы книг в PNG? Это извращение, не правда ли? Так вот вам и карты в руки — напишите приложение которое загружает текст постранично, не нарушает лимитов и соединяет всю загрузку в единый текст.

Но помните, ограничения у API есть, и главное из них, мне кажется, — то что распознается только латиница, пока только она. Кроме того нужно следить чтобы высота символов была не меньше 10 пикселей, а общий размер картинки не превышал 10 мегапикселей.

Это упрощённая версия страницы.

Читать полную версию
Если нашли ошибку, выделите текст и нажмите Ctrl + Enter
Станьте первым, кто оставит комментарий