Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
Сделай самСоветы
17 июня 2014

Как сделать электронную копию бумажной книги

Решили сделать копию бумажной книги в электронном формате DjVu или PDF? Узнайте, через какие трудности вам придется пройти и какой софт при этом пригодится.
Фото автора Пётр Глухов
Пётр Глухов

Как сделать электронную копию бумажной книги

Что для вас значит книга? Если это не просто увлекательный попутчик, но и мудрый наставник, то вы хоть раз задумывались о том, чтобы сберечь ее на будущее. Оцифровка бумажных книг имеет два несомненных преимущества: книга в электронном виде всегда под рукой, и ей очень легко делиться.

Из этого мануала вы узнаете об основных этапах создания удобной электронной версии бумажной книги с навигацией и возможностью копирования текста.

Вступление

Стоит оговориться, что в век бурной защиты авторских прав и легкой доступности литературы, изначально сверстанной в электронной форме, имеет смысл оцифровывать либо старые фундаментальные советские учебники, либо что-то действительно редкое и только для личного пользования.

Имея доступ к старым техническим справочникам, я иногда безвозмездно помогал тем незнакомым мне людям, которым так не хватало хороших источников знаний для обучения. И коль уж я подряжался, хотелось выполнить свою работу на достаточно высоком уровне, чтобы читателю книги было приятно в нее погружаться.

Этап 1. Копирование книги

Со временем многие процессы упрощаются. Если с пяток лет назад этот этап был крайне продолжительным (приходилось пользоваться сканером), то с улучшением камер мобильных телефонов затрачиваемое время существенно сократилось. Конечно, камера камере рознь, но, если подобрать приемлемые условия съемки, должен подойти любой более-менее современный телефон.

Разумеется, использование сканера все же более предпочтительно. Особенно если дело касается технической литературы, содержащей множество формул и чертежей.

Предвосхищая события, отмечу, что снимки впоследствии будут обработаны специальной программой. Но все же стоит добросовестно отнестись к самой съемке, дабы не ставить качество конечного продукта в зависимость лишь от постобработки.

Пример не самого хорошего снимка: освещение страдает, страницы до конца не распрямлены. Все ради эксперимента.
Пример не самого хорошего снимка: освещение страдает, страницы до конца не выпрямлены. Все ради эксперимента

?????????????

Поэтому постарайтесь максимально широко раскрывать страницы, чтобы изгибы у корешка книги были минимальны. Было бы здорово, если бы вам кто-то в этом помогал. Один человек держит телефон, а второй переворачивает и выпрямляет страницы. Ко всему прочему, студенты любят делать на библиотечных книгах пометки, и неплохо было бы их стереть.

Делаем серию снимков и перекидываем их на компьютер в отдельную папку. Пришла пора поработать неживому мозгу.

Этап 2. Обработка

Я сталкивался с двумя серьезными программами для обработки отсканированных (сфотографированных) книг: ScanTailor и ScanKromsator. Возможно, за годы моего инактива появились еще какие-то достойные альтернативы, но я сомневаюсь — уж очень мала и бедна пользовательская ниша. Самые прожженные книгоделы предпочитают ScanKromsator. В нем предельно много настроек и возможностей, но разобраться и понять все предложенные навороты, видимо, не в состоянии и сам автор программы (шутка). Поэтому я рекомендую вам ScanTailor. Мне довелось следить за развитием этой утилиты с первых дней ее существования. Разработчик еще несколько лет назад прекратил поддержку проекта, но все-таки дал миру хороший инструмент для обработки сканов.

Начало работы

Работа в ScanTailor последовательна и проста. Все промежуточные действия отображены в левой части рабочей области, вы с легкостью вольетесь в процесс.

Выберите папку с исходниками, выходная папка будет создана автоматически. Для всех страниц установите максимально возможное DPI — 600 × 600. Мощности современных компьютеров позволяют достаточно быстро обрабатывать такие изображения.

ScanTailor_pic1
Не жалейте DPI для своей книги

Шаг 1. Исправление ориентации

Самый простой и быстрый шаг. Скорее всего, вы изначально фотографировали страницы с верной ориентацией, потому и хлопот возникнуть не должно. Отмечу лишь, что изначально ScanTailor будет предлагать вам запустить пакетную обработку текущего действия (небольшой значок Play напротив шага) — обязательно им пользуйтесь, дабы не щелкать по каждому изображению отдельно.

ScanTailor_pic2
На мой взгляд, ScanTailor может гордиться своим продуманным интерфейсом

Шаг 2. Разрезка страниц

Практически беспроблемный шаг. Я крайне редко встречал ошибки программы на этом этапе. Обязательно обратите внимание на обложку книги — именно здесь зачастую возникают нюансы.

ScanTailor_pic3
Большей наглядности и придумать трудно

Шаг 3. Компенсация наклона

В подавляющем большинстве случаев алгоритм срабатывает корректно. Не ждите подвоха, переходите к следующему шагу.

ScanTailor_pic4
К вашим услугам ручная настройка до долей градуса

Шаг 4. Полезная область

Наверное, это самый ответственный момент. Только содержание книги имеет определяющее значение, оформление — дело вторичное. Именно с этого шага начинает работать связка “компьютер — человек”. В программе порой случаются небольшие сбои, поэтому после автоматической обработки пробегитесь глазами по миниатюрам страниц в правой части экрана. Обычно ошибки сразу бросаются в глаза.

ScanTailor_pic5
“Бракованная” полезная область будет видна при просмотре миниатюр страниц

Шаг 5. Поля

Размер полей — дело вкуса. Более важным моментом является возможность выравнивания размеров страниц. Не забудьте поставить эту галочку, чтобы не получить на выходе “пляшущие” страницы.

ScanTailor_pic6
Обложку обычно приходится дорабатывать в графическом редакторе

Шаг 6. Выход

Последний бой — он трудный самый. Плюс самый ресурсоемкий для вашего компьютера и самый требовательный к вашему вниманию.

ScanTailor_pic7
Необработанные страницы помечаются вопросительным знаком

Финишный отрезок знаменуется рядом важнейший действий. Прежде всего вы определяете выходной режим книги: черно-белый, цветной или смешанный. Затем страницы очищаются от мусора, искривленные строки выравниваются. Не буду вдаваться в подробности, но укажу вам на не самые заметные закладки, расположенные несколько нелогично и непривычно — между превью страницы и лентой миниатюр. Каждая закладка отвечает за важную функцию ручной настройки получаемых изображений. Если вы найдете желание и время вникнуть в принцип их работы, ваши книги будут более высокого качества.

Страница до и после корректировки искажения строк
Страница до и после корректировки искажения строк

Итог

Стремясь к идеалу, на эту работу вы можете потратить не один час. Все зависит от вашей заинтересованности в конечном результате и качестве исходных снимков. Да, я еще раз возвращаюсь к этой теме. Чуть большие старания на этапе подготовки могут сэкономить огромное количество времени, которое уходит на приведение страниц в приличный вид.

Прошу не брать за образец приведенные скриншоты — на все про все у меня ушло не более пары минут. Я не сомневаюсь, что забыл указать вам на некоторые нюансы работы со ScanTailor — слишком давно я ничего не обрабатывал с его помощью.

В итоге вы получите набор разрозненных страниц в формате .tif. Пора сшиваться!

Этап 3. Создание djvu-файла

Если вы хотите быстро сварганить DjVu-файл, обратитесь за помощью к малюсенькой утилите DjVu Small. Есть и более серьезные программы, например DjVu Editor Pro. Конечно, предпочтительным видится применение второго инструмента. Но решать вам: установите обе программы и сравните их возможности.

DjVu Small

Что касается создания PDF — в Интернете есть вагон и маленькая тележка соответствующих программ и веб-сервисов.

Этап 4. Создание OCR-слоя

Одним из признанных мировых лидеров в распознавании текста несомненно является компания ABBYY с ее известным продуктом FineReader. Наверное, нет таких людей, которые не слышали об этой программе, поэтому и расписывать особо нечего. С недавнего времени FineReader умеет открывать и сохранять результаты работы прямиком в DjVu, что исключает необходимость использования промежуточного софта.

Этап 5. Создание оглавления

На просторах Сети довелось встречать положительные отзывы о программе Pdf & Djvu Bookmarker. Как становится понятно из названия, софтина умеет работать с обоими самыми распространенными форматами электронных книг.

Заключение

Скорее всего, вы не осилили много букв и сразу перешли к выводам. А они для рядового человека неутешительны. Электронное книгоиздание — дело хлопотное, полное трудностей и сюрпризов. Чтобы дослужиться даже до “зеленого пояса”, вам придется потратить кучу времени. Оцифровка бумажных книг на высоком уровне — удел энтузиастов. Если вы все же решитесь пройти чертову дюжину кругов ада, то получите непередаваемые впечатления. Всегда приятно делать что-то общественно полезное и получать за это обычные человеческие благодарности.

Но в целом рекомендую остановиться после обработки в ScanTailor, объединить разрозненные страницы в PDF и дальше не лезть в дебри.

Осознанно и бессознательно я упустил кучу мелочей и нюансов, которые подстерегут вас на пути создания хорошей электронной книги. Надеюсь, что к обсуждению в комментариях подключатся знающие люди и укажут на мои неточности или расскажут о своих секретах.

Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

Находки AliExpress: самые интересные и полезные товары января

Находки AliExpress: самые интересные и полезные товары января

Платья, которые будут выглядеть уместно при любых обстоятельствах

10 платьев, которые можно надеть в обычный вторник и на вечеринку

Vsyo pro rasprodazhu brendov na AliExpress, chtoby sekonomit' do 80% byudzheta

Всё про распродажу брендов на AliExpress, чтобы сэкономить до 80% бюджета

GaN-зарядка от AOHi

Надо брать: миниатюрная GaN-зарядка от AOHi со скидкой 86%

Пусковое устройство от GEARCON

Забираем за полцены пусковое устройство с кучей полезных функций

аккумуляторные батарейки

Экономим на пальчиковых батарейках с аккумуляторным вариантом от imuto

10 naborov ruchnyh instrumentov, kotorye dolzhny byt' u kazhdogo

10 наборов ручных инструментов, которые должны быть у каждого

Дрель-шуруповёрт от Kolner

Надо брать: надёжная дрель-шуруповёрт от Kolner со скидкой 70%

Это интересно
Что подарить любимому человеку? 3 идеи от Felfri

Что подарить любимому человеку? 3 идеи от Felfri

Что такое «Редуксин Форте» и как он работает

Что такое «Редуксин Форте» и как он работает

Где в России покататься на коньках

Самый большой или самый длинный? 7 главных катков России

Мой особенный друг: как взять из приюта питомца с особыми потребностями и не пожалеть

Мой особенный друг: как взять из приюта питомца с особыми потребностями и не пожалеть

Комментарии
Oleg Ivanoff
17.06.14 21:34
И все равно даже самый простой сканер даст намного лучший результат, чем фото. А если делать на хорошем офисном МФУ, то помимо еще лучшего качества можно получить готовый файл со слоем OCR "в два клика"
Avils
17.06.14 22:40
так сканер, и тем более МФУ есть намного реже чем телефон с камерой :)
Пётр Глухов
18.06.14 00:52
Еще и с драйверами запариваться не нужно.
Сергей Давлеткулов
18.06.14 08:11
На работе обычно всегда МФУ есть, а еще там есть автоподача, если книгу не жалко, можно все страницы отрезать и просканировать. Просто 300 страниц на телефон фоткать замучаешься, а еще батарея разрядиться) А если нужно 4 страницы только, то обрабатывать их зачем? пусть и хранятся как фото)
Пётр Глухов
18.06.14 00:51
Да, конечно. Видел на просторах интернета ролики о специальных чудо-сканерах, которые сами перелистывают страницы и сканируют их со страшной скоростью. Такие бы всем :)
Kirill Pogodin
22.03.22 01:52
Добрый день, Петр, вы могли бы оказать услугу по созданию электронной книги из бумажной?
Oleg Bondarenko
18.06.14 11:03
Можно также порекомендовать: Съемка. * Раскрывать страницы стеклом, положенным сверху. Источник света сбоку, чтобы не было засветки. В идеале книгу раскрывать на 90-120 градусов, но при этом каждая страница сканируется отдельно. * Желательно сделать некий упор для книги и крепеж для камеры, чтобы компоновка кадра была постоянной. Это сэкономит кучу времени и сил позже. Например, я как-то установил камеру на трипод объективом вниз, а книгу клал по краю досок паркета. * Также желателен постоянный искусственный источник рассеянного света. * Зафиксируйте экспозицию, баланс белого, фокус, зум и проч. в вашей камере, чтобы кадры не отличались по освещенности, цвету и проч. Обработка. Можно обойтись фотошопом. Если кадры получились однотипные, настроить автоматизацию. Кадры сохранять в TIFF или сразу в PDF-принтер, коих достаточно. Если совсем на коленке, помогут программы для телефона типа CamScanner. Конечно, полноценной книги так не получить, но личный справочник или одноразовое чтиво вполне.
Oleg Bondarenko
18.06.14 11:09
Кстати, пару раз видел такое чудо: банальная мыльница или просто микрокамера на жестком крепеже над столом объективом вниз. Для сканирования документов было достаточно положить их на угол стола и нажать кнопку в компьютере - результат появлялся практически сразу (если сравнить с планшетным сканнером: поднять крышку, нажать кнопку превью, дождаться прохода, настроить прараметры, сканировать в чистовую, не забыть документ в сканнере :). Искал в продаже, видимо, плохо.
Пётр Глухов
18.06.14 11:10
Большое спасибо за дельные советы.
Сергей Аверин
18.06.14 17:49
Есть более легкий способ оцифровки, но к сожалению с потерей оригинала. Берется МФУ с автозагрузкой и двусторонним сканированием. книга расшивается и загружается в лоток. За пару минут вся книга есть в цыфровом виде.
Alex Dzerzhinsky
18.06.14 18:46
У приведенного способа есть один большой плюс - он меньше влияет на состояние книги. Для текущей литературы это неактуально, конечно же, но для старой - очень даже. У меня есть несколько книг начала 20-го века, когда меня попросили снять копию, пришлось именно фотоаппаратом переснимать, потому что сканирование планшетным сканером книга бы не пережила.
Глеб Ростовцев
18.06.14 21:07
Google goggles - 2 слова создающие текст из фотографии текста!
Artemov Andrey
20.06.14 15:03
Спасибо, для меня полезная статья!
Амин Ахмадов
28.03.17 06:35
ребят скиньте пожалуйста литературу про создание электронную копию бумажной книги, а так же историю кто первым сделал и за чем
Ostap Bender
23.11.17 08:54
Спасибо зачетная работа!
Владимир Стрелец
15.02.20 21:56
Телеграмм вам в помощь с прекрасным ботом в котором можно скачать любую электронную книгу Пользуюсь уже несколько месяцев и доволен как слон Любые новинки сразу у меня и бесплатно Ранее очень мало читал, а теперь зачитываюсь даже на работе ))
Alex Ponomar
15.02.20 22:17
Воровать – плохо.
Sergei M
15.02.20 22:31
Спасибо за подсказку! Действительно нашёл нужную книгу по Вашей наводке.
Kirill Pogodin
22.03.22 02:01
Петр, спасибо за статью! Вы могли бы оказать услугу по созданию электронной книги из бумажной? Заранее спасибо!
Что вы могли пропустить
Как часто надо стирать одежду
Как часто надо стирать одежду
0
31 января
Советы
Советы
Как организовать пространство, если ты неряха: личный опыт
Как организовать пространство, если ты неряха: личный опыт
0
30 января
Советы
Советы
Как хранить дома книги, если их очень много
Как хранить дома книги, если их очень много
0
24 января
Советы
Советы
Как отстирать гуашь с одежды
Как отстирать гуашь с одежды
0
19 января
Ликбез
Советы
Почему запотевают очки и как это исправить
Почему запотевают очки и как это исправить
0
18 января
Советы
Советы
Как убрать клей и суперклей с одежды, рук и других поверхностей
Как убрать клей и суперклей с одежды, рук и других поверхностей
0
13 января
Ликбез
Советы
Как склеить пазлы, чтобы повесить их на стену
Как склеить пазлы, чтобы повесить их на стену
0
8 января
Ликбез
Советы
Как открыть шампанское голыми руками и не только
Как открыть шампанское голыми руками и не только
0
28 декабря 2025
Ликбез
Советы
Сеть центров «Небо» запустила первую в России фиджитал-платформу для детей и подростков
Сеть центров «Небо» запустила первую в России фиджитал-платформу для детей и подростков
0
25 декабря 2025
Пресс-релизы
Советы
8 правил уборки, которые можно нарушать
8 правил уборки, которые можно нарушать
0
20 декабря 2025
Советы
Советы
Как подобрать шапку по форме лица
Как подобрать шапку по форме лица
0
11 декабря 2025
Как выбрать
Покупки
Как красиво сложить салфетки на праздничный стол
Как красиво сложить салфетки на праздничный стол
0
5 декабря 2025
Ликбез
Советы
И дом цел, и кошка счастлива. Как сделать жильё комфортным и безопасным для питомца
И дом цел, и кошка счастлива. Как сделать жильё комфортным и безопасным для питомца
0
22 ноября 2025
Советы
Советы
Какую гирлянду выбрать для дома и улицы
Какую гирлянду выбрать для дома и улицы
0
16 ноября 2025
Ликбез
Советы
Слепота к беспорядку: почему мы не замечаем бардак в доме и как это исправить
Слепота к беспорядку: почему мы не замечаем бардак в доме и как это исправить
0
15 ноября 2025
Советы
Советы

Новые комментарии

Аватар автора комментария
Индира15 минут назад

0 / 0

Смотрела фильмы "1408" (понравился), "Туман"(этот фильм не очень впечатлил)
10 жутких рассказов Стивена Кинга, которые можно прочитать за вечер
Аватар автора комментария
Индира20 минут назад

0 / 0

Конечно лечит. Ведь ты становишься моложе и тебя это бодрит )))
Правда ли ботокс лечит депрессию и тревогу
Аватар автора комментария
Индира21 минуту назад

0 / 0

Как мило... Добро всегда согревает душу )))
Новорождённый телёнок спасся от мороза на диване в доме фермеров и стал звездой Сети
Аватар автора комментария
Наталья Мурахтанова22 минуты назад

0 / 0

Книжная концовка «Тумана», на мой взгляд, интереснее. Вроде как есть надежда, но очень уж она призрачная. И это больше бьёт по нервам)
10 жутких рассказов Стивена Кинга, которые можно прочитать за вечер
Добро пожаловать в научную фантастику! Как технологии меняют современные компании и жизнь их клиентов

Добро пожаловать в научную фантастику! Как технологии меняют современные компании и жизнь их клиентов

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииДля начинающих авторовО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях