Лучшее
Рубрики
Рецепты
Промокоды
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Промокоды
Подкасты
Сервисы
Колонки
Теории большого мира
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Научпоп
Отношения
Реклама
Сделай сам Советы 17 июня 2014

Как сделать электронную копию бумажной книги

Решили сделать копию бумажной книги в электронном формате DjVu или PDF? Узнайте, через какие трудности вам придется пройти и какой софт при этом пригодится.
Фото автора Пётр Глухов
Пётр Глухов

Как сделать электронную копию бумажной книги
Избранное

Что для вас значит книга? Если это не просто увлекательный попутчик, но и мудрый наставник, то вы хоть раз задумывались о том, чтобы сберечь ее на будущее. Оцифровка бумажных книг имеет два несомненных преимущества: книга в электронном виде всегда под рукой, и ей очень легко делиться.

Из этого мануала вы узнаете об основных этапах создания удобной электронной версии бумажной книги с навигацией и возможностью копирования текста.

Вступление

Стоит оговориться, что в век бурной защиты авторских прав и легкой доступности литературы, изначально сверстанной в электронной форме, имеет смысл оцифровывать либо старые фундаментальные советские учебники, либо что-то действительно редкое и только для личного пользования.

Имея доступ к старым техническим справочникам, я иногда безвозмездно помогал тем незнакомым мне людям, которым так не хватало хороших источников знаний для обучения. И коль уж я подряжался, хотелось выполнить свою работу на достаточно высоком уровне, чтобы читателю книги было приятно в нее погружаться.

Этап 1. Копирование книги

Со временем многие процессы упрощаются. Если с пяток лет назад этот этап был крайне продолжительным (приходилось пользоваться сканером), то с улучшением камер мобильных телефонов затрачиваемое время существенно сократилось. Конечно, камера камере рознь, но, если подобрать приемлемые условия съемки, должен подойти любой более-менее современный телефон.

Разумеется, использование сканера все же более предпочтительно. Особенно если дело касается технической литературы, содержащей множество формул и чертежей.

Предвосхищая события, отмечу, что снимки впоследствии будут обработаны специальной программой. Но все же стоит добросовестно отнестись к самой съемке, дабы не ставить качество конечного продукта в зависимость лишь от постобработки.

Пример не самого хорошего снимка: освещение страдает, страницы до конца не выпрямлены. Все ради эксперимента

Поэтому постарайтесь максимально широко раскрывать страницы, чтобы изгибы у корешка книги были минимальны. Было бы здорово, если бы вам кто-то в этом помогал. Один человек держит телефон, а второй переворачивает и выпрямляет страницы. Ко всему прочему, студенты любят делать на библиотечных книгах пометки, и неплохо было бы их стереть.

Делаем серию снимков и перекидываем их на компьютер в отдельную папку. Пришла пора поработать неживому мозгу.

Этап 2. Обработка

Я сталкивался с двумя серьезными программами для обработки отсканированных (сфотографированных) книг: ScanTailor и ScanKromsator. Возможно, за годы моего инактива появились еще какие-то достойные альтернативы, но я сомневаюсь — уж очень мала и бедна пользовательская ниша. Самые прожженные книгоделы предпочитают ScanKromsator. В нем предельно много настроек и возможностей, но разобраться и понять все предложенные навороты, видимо, не в состоянии и сам автор программы (шутка). Поэтому я рекомендую вам ScanTailor. Мне довелось следить за развитием этой утилиты с первых дней ее существования. Разработчик еще несколько лет назад прекратил поддержку проекта, но все-таки дал миру хороший инструмент для обработки сканов.

Начало работы

Работа в ScanTailor последовательна и проста. Все промежуточные действия отображены в левой части рабочей области, вы с легкостью вольетесь в процесс.

Выберите папку с исходниками, выходная папка будет создана автоматически. Для всех страниц установите максимально возможное DPI — 600 × 600. Мощности современных компьютеров позволяют достаточно быстро обрабатывать такие изображения.

Не жалейте DPI для своей книги

Шаг 1. Исправление ориентации

Самый простой и быстрый шаг. Скорее всего, вы изначально фотографировали страницы с верной ориентацией, потому и хлопот возникнуть не должно. Отмечу лишь, что изначально ScanTailor будет предлагать вам запустить пакетную обработку текущего действия (небольшой значок Play напротив шага) — обязательно им пользуйтесь, дабы не щелкать по каждому изображению отдельно.

На мой взгляд, ScanTailor может гордиться своим продуманным интерфейсом

Шаг 2. Разрезка страниц

Практически беспроблемный шаг. Я крайне редко встречал ошибки программы на этом этапе. Обязательно обратите внимание на обложку книги — именно здесь зачастую возникают нюансы.

Большей наглядности и придумать трудно

Шаг 3. Компенсация наклона

В подавляющем большинстве случаев алгоритм срабатывает корректно. Не ждите подвоха, переходите к следующему шагу.

К вашим услугам ручная настройка до долей градуса

Шаг 4. Полезная область

Наверное, это самый ответственный момент. Только содержание книги имеет определяющее значение, оформление — дело вторичное. Именно с этого шага начинает работать связка «компьютер — человек». В программе порой случаются небольшие сбои, поэтому после автоматической обработки пробегитесь глазами по миниатюрам страниц в правой части экрана. Обычно ошибки сразу бросаются в глаза.

«Бракованная» полезная область будет видна при просмотре миниатюр страниц

Шаг 5. Поля

Размер полей — дело вкуса. Более важным моментом является возможность выравнивания размеров страниц. Не забудьте поставить эту галочку, чтобы не получить на выходе «пляшущие» страницы.

Обложку обычно приходится дорабатывать в графическом редакторе

Шаг 6. Выход

Последний бой — он трудный самый. Плюс самый ресурсоемкий для вашего компьютера и самый требовательный к вашему вниманию.

Необработанные страницы помечаются вопросительным знаком

Финишный отрезок знаменуется рядом важнейший действий. Прежде всего вы определяете выходной режим книги: черно-белый, цветной или смешанный. Затем страницы очищаются от мусора, искривленные строки выравниваются. Не буду вдаваться в подробности, но укажу вам на не самые заметные закладки, расположенные несколько нелогично и непривычно — между превью страницы и лентой миниатюр. Каждая закладка отвечает за важную функцию ручной настройки получаемых изображений. Если вы найдете желание и время вникнуть в принцип их работы, ваши книги будут более высокого качества.

Страница до и после корректировки искажения строк

Итог

Стремясь к идеалу, на эту работу вы можете потратить не один час. Все зависит от вашей заинтересованности в конечном результате и качестве исходных снимков. Да, я еще раз возвращаюсь к этой теме. Чуть большие старания на этапе подготовки могут сэкономить огромное количество времени, которое уходит на приведение страниц в приличный вид.

Прошу не брать за образец приведенные скриншоты — на все про все у меня ушло не более пары минут. Я не сомневаюсь, что забыл указать вам на некоторые нюансы работы со ScanTailor — слишком давно я ничего не обрабатывал с его помощью.

В итоге вы получите набор разрозненных страниц в формате .tif. Пора сшиваться!

Этап 3. Создание djvu-файла

Если вы хотите быстро сварганить DjVu-файл, обратитесь за помощью к малюсенькой утилите DjVu Small. Есть и более серьезные программы, например DjVu Editor Pro. Конечно, предпочтительным видится применение второго инструмента. Но решать вам: установите обе программы и сравните их возможности.

Что касается создания PDF — в Интернете есть вагон и маленькая тележка соответствующих программ и веб-сервисов.

Этап 4. Создание OCR-слоя

Одним из признанных мировых лидеров в распознавании текста несомненно является компания ABBYY с ее известным продуктом FineReader. Наверное, нет таких людей, которые не слышали об этой программе, поэтому и расписывать особо нечего. С недавнего времени FineReader умеет открывать и сохранять результаты работы прямиком в DjVu, что исключает необходимость использования промежуточного софта.

Этап 5. Создание оглавления

На просторах Сети довелось встречать положительные отзывы о программе Pdf & Djvu Bookmarker. Как становится понятно из названия, софтина умеет работать с обоими самыми распространенными форматами электронных книг.

Заключение

Скорее всего, вы не осилили много букв и сразу перешли к выводам. А они для рядового человека неутешительны. Электронное книгоиздание — дело хлопотное, полное трудностей и сюрпризов. Чтобы дослужиться даже до «зеленого пояса», вам придется потратить кучу времени. Оцифровка бумажных книг на высоком уровне — удел энтузиастов. Если вы все же решитесь пройти чертову дюжину кругов ада, то получите непередаваемые впечатления. Всегда приятно делать что-то общественно полезное и получать за это обычные человеческие благодарности.

Но в целом рекомендую остановиться после обработки в ScanTailor, объединить разрозненные страницы в PDF и дальше не лезть в дебри.

Осознанно и бессознательно я упустил кучу мелочей и нюансов, которые подстерегут вас на пути создания хорошей электронной книги. Надеюсь, что к обсуждению в комментариях подключатся знающие люди и укажут на мои неточности или расскажут о своих секретах.

Если нашли ошибку, выделите текст и нажмите Ctrl + Enter
Избранное
Комментарии
Oleg Ivanoff
17.06.14 20:34
И все равно даже самый простой сканер даст намного лучший результат, чем фото. А если делать на хорошем офисном МФУ, то помимо еще лучшего качества можно получить готовый файл со слоем OCR "в два клика"
Avils
17.06.14 21:40
так сканер, и тем более МФУ есть намного реже чем телефон с камерой :)
Пётр Глухов
17.06.14 23:52
Еще и с драйверами запариваться не нужно.
Сергей Давлеткулов
18.06.14 07:11
На работе обычно всегда МФУ есть, а еще там есть автоподача, если книгу не жалко, можно все страницы отрезать и просканировать. Просто 300 страниц на телефон фоткать замучаешься, а еще батарея разрядиться) А если нужно 4 страницы только, то обрабатывать их зачем? пусть и хранятся как фото)
Пётр Глухов
17.06.14 23:51
Да, конечно. Видел на просторах интернета ролики о специальных чудо-сканерах, которые сами перелистывают страницы и сканируют их со страшной скоростью. Такие бы всем :)
Kirill Pogodin
22.03.22 01:52
Добрый день, Петр, вы могли бы оказать услугу по созданию электронной книги из бумажной?
Oleg Bondarenko
18.06.14 10:03
Можно также порекомендовать: Съемка. * Раскрывать страницы стеклом, положенным сверху. Источник света сбоку, чтобы не было засветки. В идеале книгу раскрывать на 90-120 градусов, но при этом каждая страница сканируется отдельно. * Желательно сделать некий упор для книги и крепеж для камеры, чтобы компоновка кадра была постоянной. Это сэкономит кучу времени и сил позже. Например, я как-то установил камеру на трипод объективом вниз, а книгу клал по краю досок паркета. * Также желателен постоянный искусственный источник рассеянного света. * Зафиксируйте экспозицию, баланс белого, фокус, зум и проч. в вашей камере, чтобы кадры не отличались по освещенности, цвету и проч. Обработка. Можно обойтись фотошопом. Если кадры получились однотипные, настроить автоматизацию. Кадры сохранять в TIFF или сразу в PDF-принтер, коих достаточно. Если совсем на коленке, помогут программы для телефона типа CamScanner. Конечно, полноценной книги так не получить, но личный справочник или одноразовое чтиво вполне.
Oleg Bondarenko
18.06.14 10:09
Кстати, пару раз видел такое чудо: банальная мыльница или просто микрокамера на жестком крепеже над столом объективом вниз. Для сканирования документов было достаточно положить их на угол стола и нажать кнопку в компьютере - результат появлялся практически сразу (если сравнить с планшетным сканнером: поднять крышку, нажать кнопку превью, дождаться прохода, настроить прараметры, сканировать в чистовую, не забыть документ в сканнере :). Искал в продаже, видимо, плохо.
Пётр Глухов
18.06.14 10:10
Большое спасибо за дельные советы.
Сергей Аверин
18.06.14 16:49
Есть более легкий способ оцифровки, но к сожалению с потерей оригинала. Берется МФУ с автозагрузкой и двусторонним сканированием. книга расшивается и загружается в лоток. За пару минут вся книга есть в цыфровом виде.
Alex Dzerzhinsky
18.06.14 17:46
У приведенного способа есть один большой плюс - он меньше влияет на состояние книги. Для текущей литературы это неактуально, конечно же, но для старой - очень даже. У меня есть несколько книг начала 20-го века, когда меня попросили снять копию, пришлось именно фотоаппаратом переснимать, потому что сканирование планшетным сканером книга бы не пережила.
Глеб Ростовцев
18.06.14 20:07
Google goggles - 2 слова создающие текст из фотографии текста!
Artemov Andrey
20.06.14 14:03
Спасибо, для меня полезная статья!
Амин Ахмадов
28.03.17 06:35
ребят скиньте пожалуйста литературу про создание электронную копию бумажной книги, а так же историю кто первым сделал и за чем
Ostap Bender
23.11.17 08:54
Спасибо зачетная работа!
Владимир Стрелец
15.02.20 21:56
Телеграмм вам в помощь с прекрасным ботом в котором можно скачать любую электронную книгу Пользуюсь уже несколько месяцев и доволен как слон Любые новинки сразу у меня и бесплатно Ранее очень мало читал, а теперь зачитываюсь даже на работе ))
Alex Ponomar
15.02.20 22:17
Воровать – плохо.
Sergei M
15.02.20 22:31
Спасибо за подсказку! Действительно нашёл нужную книгу по Вашей наводке.
Kirill Pogodin
22.03.22 02:01
Петр, спасибо за статью! Вы могли бы оказать услугу по созданию электронной книги из бумажной? Заранее спасибо!
Информация
О проектеРубрикиРекламаРедакцияВакансии
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила сообщества
18+Копирование материалов запрещено. Издание может получать комиссию от покупки товаров, представленных в публикациях