Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
🎄 Ёлка Лайфхакера
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
Сделай самСоветы
17 июня 2014

Как сделать электронную копию бумажной книги

Решили сделать копию бумажной книги в электронном формате DjVu или PDF? Узнайте, через какие трудности вам придется пройти и какой софт при этом пригодится.
Фото автора Пётр Глухов
Пётр Глухов

Как сделать электронную копию бумажной книги

Что для вас значит книга? Если это не просто увлекательный попутчик, но и мудрый наставник, то вы хоть раз задумывались о том, чтобы сберечь ее на будущее. Оцифровка бумажных книг имеет два несомненных преимущества: книга в электронном виде всегда под рукой, и ей очень легко делиться.

Из этого мануала вы узнаете об основных этапах создания удобной электронной версии бумажной книги с навигацией и возможностью копирования текста.

Вступление

Стоит оговориться, что в век бурной защиты авторских прав и легкой доступности литературы, изначально сверстанной в электронной форме, имеет смысл оцифровывать либо старые фундаментальные советские учебники, либо что-то действительно редкое и только для личного пользования.

Имея доступ к старым техническим справочникам, я иногда безвозмездно помогал тем незнакомым мне людям, которым так не хватало хороших источников знаний для обучения. И коль уж я подряжался, хотелось выполнить свою работу на достаточно высоком уровне, чтобы читателю книги было приятно в нее погружаться.

Этап 1. Копирование книги

Со временем многие процессы упрощаются. Если с пяток лет назад этот этап был крайне продолжительным (приходилось пользоваться сканером), то с улучшением камер мобильных телефонов затрачиваемое время существенно сократилось. Конечно, камера камере рознь, но, если подобрать приемлемые условия съемки, должен подойти любой более-менее современный телефон.

Разумеется, использование сканера все же более предпочтительно. Особенно если дело касается технической литературы, содержащей множество формул и чертежей.

Предвосхищая события, отмечу, что снимки впоследствии будут обработаны специальной программой. Но все же стоит добросовестно отнестись к самой съемке, дабы не ставить качество конечного продукта в зависимость лишь от постобработки.

Пример не самого хорошего снимка: освещение страдает, страницы до конца не распрямлены. Все ради эксперимента.
Пример не самого хорошего снимка: освещение страдает, страницы до конца не выпрямлены. Все ради эксперимента

?????????????

Поэтому постарайтесь максимально широко раскрывать страницы, чтобы изгибы у корешка книги были минимальны. Было бы здорово, если бы вам кто-то в этом помогал. Один человек держит телефон, а второй переворачивает и выпрямляет страницы. Ко всему прочему, студенты любят делать на библиотечных книгах пометки, и неплохо было бы их стереть.

Делаем серию снимков и перекидываем их на компьютер в отдельную папку. Пришла пора поработать неживому мозгу.

Этап 2. Обработка

Я сталкивался с двумя серьезными программами для обработки отсканированных (сфотографированных) книг: ScanTailor и ScanKromsator. Возможно, за годы моего инактива появились еще какие-то достойные альтернативы, но я сомневаюсь — уж очень мала и бедна пользовательская ниша. Самые прожженные книгоделы предпочитают ScanKromsator. В нем предельно много настроек и возможностей, но разобраться и понять все предложенные навороты, видимо, не в состоянии и сам автор программы (шутка). Поэтому я рекомендую вам ScanTailor. Мне довелось следить за развитием этой утилиты с первых дней ее существования. Разработчик еще несколько лет назад прекратил поддержку проекта, но все-таки дал миру хороший инструмент для обработки сканов.

Начало работы

Работа в ScanTailor последовательна и проста. Все промежуточные действия отображены в левой части рабочей области, вы с легкостью вольетесь в процесс.

Выберите папку с исходниками, выходная папка будет создана автоматически. Для всех страниц установите максимально возможное DPI — 600 × 600. Мощности современных компьютеров позволяют достаточно быстро обрабатывать такие изображения.

ScanTailor_pic1
Не жалейте DPI для своей книги

Шаг 1. Исправление ориентации

Самый простой и быстрый шаг. Скорее всего, вы изначально фотографировали страницы с верной ориентацией, потому и хлопот возникнуть не должно. Отмечу лишь, что изначально ScanTailor будет предлагать вам запустить пакетную обработку текущего действия (небольшой значок Play напротив шага) — обязательно им пользуйтесь, дабы не щелкать по каждому изображению отдельно.

ScanTailor_pic2
На мой взгляд, ScanTailor может гордиться своим продуманным интерфейсом

Шаг 2. Разрезка страниц

Практически беспроблемный шаг. Я крайне редко встречал ошибки программы на этом этапе. Обязательно обратите внимание на обложку книги — именно здесь зачастую возникают нюансы.

ScanTailor_pic3
Большей наглядности и придумать трудно

Шаг 3. Компенсация наклона

В подавляющем большинстве случаев алгоритм срабатывает корректно. Не ждите подвоха, переходите к следующему шагу.

ScanTailor_pic4
К вашим услугам ручная настройка до долей градуса

Шаг 4. Полезная область

Наверное, это самый ответственный момент. Только содержание книги имеет определяющее значение, оформление — дело вторичное. Именно с этого шага начинает работать связка “компьютер — человек”. В программе порой случаются небольшие сбои, поэтому после автоматической обработки пробегитесь глазами по миниатюрам страниц в правой части экрана. Обычно ошибки сразу бросаются в глаза.

ScanTailor_pic5
“Бракованная” полезная область будет видна при просмотре миниатюр страниц

Шаг 5. Поля

Размер полей — дело вкуса. Более важным моментом является возможность выравнивания размеров страниц. Не забудьте поставить эту галочку, чтобы не получить на выходе “пляшущие” страницы.

ScanTailor_pic6
Обложку обычно приходится дорабатывать в графическом редакторе

Шаг 6. Выход

Последний бой — он трудный самый. Плюс самый ресурсоемкий для вашего компьютера и самый требовательный к вашему вниманию.

ScanTailor_pic7
Необработанные страницы помечаются вопросительным знаком

Финишный отрезок знаменуется рядом важнейший действий. Прежде всего вы определяете выходной режим книги: черно-белый, цветной или смешанный. Затем страницы очищаются от мусора, искривленные строки выравниваются. Не буду вдаваться в подробности, но укажу вам на не самые заметные закладки, расположенные несколько нелогично и непривычно — между превью страницы и лентой миниатюр. Каждая закладка отвечает за важную функцию ручной настройки получаемых изображений. Если вы найдете желание и время вникнуть в принцип их работы, ваши книги будут более высокого качества.

Страница до и после корректировки искажения строк
Страница до и после корректировки искажения строк

Итог

Стремясь к идеалу, на эту работу вы можете потратить не один час. Все зависит от вашей заинтересованности в конечном результате и качестве исходных снимков. Да, я еще раз возвращаюсь к этой теме. Чуть большие старания на этапе подготовки могут сэкономить огромное количество времени, которое уходит на приведение страниц в приличный вид.

Прошу не брать за образец приведенные скриншоты — на все про все у меня ушло не более пары минут. Я не сомневаюсь, что забыл указать вам на некоторые нюансы работы со ScanTailor — слишком давно я ничего не обрабатывал с его помощью.

В итоге вы получите набор разрозненных страниц в формате .tif. Пора сшиваться!

Этап 3. Создание djvu-файла

Если вы хотите быстро сварганить DjVu-файл, обратитесь за помощью к малюсенькой утилите DjVu Small. Есть и более серьезные программы, например DjVu Editor Pro. Конечно, предпочтительным видится применение второго инструмента. Но решать вам: установите обе программы и сравните их возможности.

DjVu Small

Что касается создания PDF — в Интернете есть вагон и маленькая тележка соответствующих программ и веб-сервисов.

Этап 4. Создание OCR-слоя

Одним из признанных мировых лидеров в распознавании текста несомненно является компания ABBYY с ее известным продуктом FineReader. Наверное, нет таких людей, которые не слышали об этой программе, поэтому и расписывать особо нечего. С недавнего времени FineReader умеет открывать и сохранять результаты работы прямиком в DjVu, что исключает необходимость использования промежуточного софта.

Этап 5. Создание оглавления

На просторах Сети довелось встречать положительные отзывы о программе Pdf & Djvu Bookmarker. Как становится понятно из названия, софтина умеет работать с обоими самыми распространенными форматами электронных книг.

Заключение

Скорее всего, вы не осилили много букв и сразу перешли к выводам. А они для рядового человека неутешительны. Электронное книгоиздание — дело хлопотное, полное трудностей и сюрпризов. Чтобы дослужиться даже до “зеленого пояса”, вам придется потратить кучу времени. Оцифровка бумажных книг на высоком уровне — удел энтузиастов. Если вы все же решитесь пройти чертову дюжину кругов ада, то получите непередаваемые впечатления. Всегда приятно делать что-то общественно полезное и получать за это обычные человеческие благодарности.

Но в целом рекомендую остановиться после обработки в ScanTailor, объединить разрозненные страницы в PDF и дальше не лезть в дебри.

Осознанно и бессознательно я упустил кучу мелочей и нюансов, которые подстерегут вас на пути создания хорошей электронной книги. Надеюсь, что к обсуждению в комментариях подключатся знающие люди и укажут на мои неточности или расскажут о своих секретах.

Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

OnePlus 15R

Надо брать: новый субфлагман OnePlus 15R дешевле 39 000 рублей на AliExpress

42 отличных товара, которые часто покупают на AliExpress

36 отличных товаров, которые часто покупают на AliExpress

5 samyh populyarnyh vneshnih akkumulyatorov s AliExpress

5 самых популярных внешних аккумуляторов с AliExpress

Кроссовки от Golden Camel

Надо брать: качественные зимние кроссовки от Golden Camel за полцены

10 muzhskih zimnih kurtok so skidkami do 64%

10 мужских зимних курток со скидками до 64%

У этого шуруповёрта тысячи восторженных отзывов на маркетплейсах

У этого шуруповёрта тысячи восторженных отзывов на маркетплейсах

Находки AliExpress: самые интересные и полезные товары 2025 года

Находки AliExpress: самые интересные и полезные товары 2025 года

Апельсиновая Альфа-карта

Забираем дебетовую карту с кешбэком 7% и 5 000 баллов в «Пятёрочке»

Это интересно
Что делать, если ваш сайт упал: пошаговая инструкция для предпринимателей от Т2

Что делать, если ваш сайт упал: пошаговая инструкция для предпринимателей от Т2

Реклама
3 главных мифа о работниках старшего поколения 

3 главных мифа о работниках старшего поколения 

Надо брать: «Имаджинариум» — культовая игра на ассоциации

Надо брать: «Имаджинариум» — культовая игра на ассоциации

Мой особенный друг: как взять из приюта питомца с особыми потребностями и не пожалеть

Мой особенный друг: как взять из приюта питомца с особыми потребностями и не пожалеть

Комментарии
Oleg Ivanoff
17.06.14 21:34
И все равно даже самый простой сканер даст намного лучший результат, чем фото. А если делать на хорошем офисном МФУ, то помимо еще лучшего качества можно получить готовый файл со слоем OCR "в два клика"
Avils
17.06.14 22:40
так сканер, и тем более МФУ есть намного реже чем телефон с камерой :)
Пётр Глухов
18.06.14 00:52
Еще и с драйверами запариваться не нужно.
Сергей Давлеткулов
18.06.14 08:11
На работе обычно всегда МФУ есть, а еще там есть автоподача, если книгу не жалко, можно все страницы отрезать и просканировать. Просто 300 страниц на телефон фоткать замучаешься, а еще батарея разрядиться) А если нужно 4 страницы только, то обрабатывать их зачем? пусть и хранятся как фото)
Пётр Глухов
18.06.14 00:51
Да, конечно. Видел на просторах интернета ролики о специальных чудо-сканерах, которые сами перелистывают страницы и сканируют их со страшной скоростью. Такие бы всем :)
Kirill Pogodin
22.03.22 01:52
Добрый день, Петр, вы могли бы оказать услугу по созданию электронной книги из бумажной?
Oleg Bondarenko
18.06.14 11:03
Можно также порекомендовать: Съемка. * Раскрывать страницы стеклом, положенным сверху. Источник света сбоку, чтобы не было засветки. В идеале книгу раскрывать на 90-120 градусов, но при этом каждая страница сканируется отдельно. * Желательно сделать некий упор для книги и крепеж для камеры, чтобы компоновка кадра была постоянной. Это сэкономит кучу времени и сил позже. Например, я как-то установил камеру на трипод объективом вниз, а книгу клал по краю досок паркета. * Также желателен постоянный искусственный источник рассеянного света. * Зафиксируйте экспозицию, баланс белого, фокус, зум и проч. в вашей камере, чтобы кадры не отличались по освещенности, цвету и проч. Обработка. Можно обойтись фотошопом. Если кадры получились однотипные, настроить автоматизацию. Кадры сохранять в TIFF или сразу в PDF-принтер, коих достаточно. Если совсем на коленке, помогут программы для телефона типа CamScanner. Конечно, полноценной книги так не получить, но личный справочник или одноразовое чтиво вполне.
Oleg Bondarenko
18.06.14 11:09
Кстати, пару раз видел такое чудо: банальная мыльница или просто микрокамера на жестком крепеже над столом объективом вниз. Для сканирования документов было достаточно положить их на угол стола и нажать кнопку в компьютере - результат появлялся практически сразу (если сравнить с планшетным сканнером: поднять крышку, нажать кнопку превью, дождаться прохода, настроить прараметры, сканировать в чистовую, не забыть документ в сканнере :). Искал в продаже, видимо, плохо.
Пётр Глухов
18.06.14 11:10
Большое спасибо за дельные советы.
Сергей Аверин
18.06.14 17:49
Есть более легкий способ оцифровки, но к сожалению с потерей оригинала. Берется МФУ с автозагрузкой и двусторонним сканированием. книга расшивается и загружается в лоток. За пару минут вся книга есть в цыфровом виде.
Alex Dzerzhinsky
18.06.14 18:46
У приведенного способа есть один большой плюс - он меньше влияет на состояние книги. Для текущей литературы это неактуально, конечно же, но для старой - очень даже. У меня есть несколько книг начала 20-го века, когда меня попросили снять копию, пришлось именно фотоаппаратом переснимать, потому что сканирование планшетным сканером книга бы не пережила.
Глеб Ростовцев
18.06.14 21:07
Google goggles - 2 слова создающие текст из фотографии текста!
Artemov Andrey
20.06.14 15:03
Спасибо, для меня полезная статья!
Амин Ахмадов
28.03.17 06:35
ребят скиньте пожалуйста литературу про создание электронную копию бумажной книги, а так же историю кто первым сделал и за чем
Ostap Bender
23.11.17 08:54
Спасибо зачетная работа!
Владимир Стрелец
15.02.20 21:56
Телеграмм вам в помощь с прекрасным ботом в котором можно скачать любую электронную книгу Пользуюсь уже несколько месяцев и доволен как слон Любые новинки сразу у меня и бесплатно Ранее очень мало читал, а теперь зачитываюсь даже на работе ))
Alex Ponomar
15.02.20 22:17
Воровать – плохо.
Sergei M
15.02.20 22:31
Спасибо за подсказку! Действительно нашёл нужную книгу по Вашей наводке.
Kirill Pogodin
22.03.22 02:01
Петр, спасибо за статью! Вы могли бы оказать услугу по созданию электронной книги из бумажной? Заранее спасибо!
Что вы могли пропустить
Как склеить пазлы, чтобы повесить их на стену
Как склеить пазлы, чтобы повесить их на стену
0
Вчера
Ликбез
Советы
Как открыть шампанское голыми руками и не только
Как открыть шампанское голыми руками и не только
0
28 декабря 2025
Ликбез
Советы
Сеть центров «Небо» запустила первую в России фиджитал-платформу для детей и подростков
Сеть центров «Небо» запустила первую в России фиджитал-платформу для детей и подростков
0
25 декабря 2025
Пресс-релизы
Советы
8 правил уборки, которые можно нарушать
8 правил уборки, которые можно нарушать
0
20 декабря 2025
Советы
Советы
Как подобрать шапку по форме лица
Как подобрать шапку по форме лица
0
11 декабря 2025
Как выбрать
Покупки
Как красиво сложить салфетки на праздничный стол
Как красиво сложить салфетки на праздничный стол
0
5 декабря 2025
Ликбез
Советы
И дом цел, и кошка счастлива. Как сделать жильё комфортным и безопасным для питомца
И дом цел, и кошка счастлива. Как сделать жильё комфортным и безопасным для питомца
0
22 ноября 2025
Советы
Советы
Какую гирлянду выбрать для дома и улицы
Какую гирлянду выбрать для дома и улицы
0
16 ноября 2025
Ликбез
Советы
Слепота к беспорядку: почему мы не замечаем бардак в доме и как это исправить
Слепота к беспорядку: почему мы не замечаем бардак в доме и как это исправить
0
15 ноября 2025
Советы
Советы
5 советов, как сделать прихожую удобной и стильной
5 советов, как сделать прихожую удобной и стильной
0
11 ноября 2025
Колонка
Советы
Как почистить латунь
Как почистить латунь
0
8 ноября 2025
Ликбез
Советы
Как почистить кулер для воды в домашних условиях
Как почистить кулер для воды в домашних условиях
0
2 ноября 2025
Ликбез
Советы
Правда ли контейнер пылесоса надо чистить сразу после уборки
Правда ли контейнер пылесоса надо чистить сразу после уборки
0
25 октября 2025
Советы
Советы
Как отличить хрусталь от стекла
Как отличить хрусталь от стекла
0
24 октября 2025
Ликбез
Советы
Как избавиться от запаха канализации
Как избавиться от запаха канализации
0
18 октября 2025
Ликбез
Советы

Новые комментарии

Аватар автора комментария
Иван Иванов1 час назад

0 / 0

Мое мнение именно по выборке произведений с картинок. Я не обобщаю. Как игроман а не киноман, расскажу про ремастеры игр. Ремастеры и ремейки - не равно оригинальные игры, сейчас перечисленные игры если и живы и играбельны, то только в виде кораблей Тесея, когда перелопачено буквально все и условно сохранен только дух оригинала. Вампиры, деус экс, спайро, сталкер, диабло, томб райдер - все это переделано очень сильно сейчас, чтобы оно стало рабочим и хорошим. А муровинд я подозреваю вообще невозможно починить, он гнилой в каждой детали, буквально!
Unc Slop или «дядины помои» — зумеры высмеивают культовые для миллениалов игры, сериалы и аниме
Аватар автора комментария
Виктор Медведев1 час назад

0 / 0

Изображение
Фанаты «Очень странных дел» ждут секретный 9-й эпизод пятого сезона — он должен выйти на днях
Аватар автора комментария
Артём Козориз3 часа назад

+1 / 0

Самоуверенности и нахальства вам, конечно, не занимать. Разбрасываетесь здесь громкими словами про «деградацию образования», но при этом именно ваши комментарии (все как один) — идеальная иллюстрация этой самой деградации в действии. Вы даже не замечаете, что несёте взаимоисключающие вещи в одном и том же треде и с серьёзным видом объявляете это «законами физики». Продолжаете мантру «чёрного цвета не бывает» и «чёрный — это отсутствие света», одновременно рассуждая про чёрный фон на LCD. Вы вообще понимаете, что в реальном мониторе никакого «отсутствия фотонов» нет в принципе? Подсветка в обычной LCD‑матрице работает постоянно, а ваше «чёрное» — это грязная попытка кристаллов и фильтров хоть как‑то задушить поток света. Включите любой монитор в тёмной комнате и посмотрите на «чёрный» экран. Он СВЕТИТСЯ. И продолжать после этого доказывать, что «чёрный фон означает отсутствие фотонов», — это уже не базовая физика, а полная оторванность от реальности. История с красными буквами — отдельный цирк. Сначала сами пишете, что «если поставить красные буквы, то вообще не будет вашего любимого синего цвета». Потом через два комментария называете эту же идею «идиотизмом, который мог прийти только в мою голову». Вы хотя бы перечитывайте собственные пассажи, прежде чем раздавать диагнозы окружающим. А то получается, что вы сначала придумываете себе аргумент, потом забываете, что это ВАШ аргумент, и начинаете высмеивать его как чужой. Очень наглядная демонстрация того, насколько у вас всё стабильно в голове (воспалённой или чего ещё, не берусь утверждать — медицинского образования не имею, да и боюсь не каждый доктор тут справится). Про «отражённый и прямой свет всегда одинаков» вы тоже красиво вляпались. Уже несколько раз пришлось объяснять, что фотоны как кванты — да, одинаковы. Но глаз интересует не философия «одинаковости фотонов», а мощность и геометрия потока. Эмиссионный источник, который светит напрямую в зрачок, и рефлективная поверхность, рассеивающая внешний свет, — это разные режимы освещения, с разной нагрузкой на сетчатку. Вы же упрямо притворяетесь, что это «идиотский посыл», потому что в вашей картине мира всё сводится к одной фразе «фотоны одинаковы». При таком уровне упрощения очень удобно объявлять себя носителем истины и «законов физики», а всех остальных записывать в секту. И, конечно же, ваш излюбленный приём — объявлять любую неудобную для вас вещь «не относящейся к делу». Исследования — «набор слов». Измерения — «цитаты из интернета». Реальное поведение LCD в темноте, которое каждый может увидеть невооружённым глазом без какого-либо образования и знаний — тоже, видимо, «не аргумент». Зато голословное «яркость будет на порядок меньше», сказанное без единого измерения, у вас почему‑то сразу превращается в непреложный закон природы. Вы требуете от других «базовых знаний», но сами не в состоянии отличить школьную абстракцию «чёрный как отсутствие света» от работы конкретного устройства с постоянно горящей подсветкой. В итоге, под всем этим наносным пафосом, мы видим человека, который публично демонстрирует полное непонимание того, как устроен экран, как работает подсветка и что такое реальный чёрный цвет, но при этом размахивает словом «дебилизм» и рассказывает про чужую «некомпетентность». Если уж кому и стоит переживать за выданный школьный аттестат, так это вам!
14 классных электронных книг — от премиальных до бюджетных моделей
Аватар автора комментария
Виктор Подволоцкий3 часа назад

0 / 0

Его придумали фанаты) но внезапный эпизод - да, это было бы не просто смело...
Фанаты «Очень странных дел» ждут секретный 9-й эпизод пятого сезона — он должен выйти на днях
Добро пожаловать в научную фантастику! Как технологии меняют современные компании и жизнь их клиентов

Добро пожаловать в научную фантастику! Как технологии меняют современные компании и жизнь их клиентов

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииДля начинающих авторовО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях