Лайфхакер
Лайфхакер
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
Лучшее
Рубрики
Рецепты
Подкасты
Сервисы
Колонки
🧡 Осень в радость
Новости
Здоровье
Спорт и фитнес
Покупки
Технологии
Отношения
Кино
Реклама
Сделай самСоветы
17 июня 2014

Как сделать электронную копию бумажной книги

Решили сделать копию бумажной книги в электронном формате DjVu или PDF? Узнайте, через какие трудности вам придется пройти и какой софт при этом пригодится.
Фото автора Пётр Глухов
Пётр Глухов

Как сделать электронную копию бумажной книги

Что для вас значит книга? Если это не просто увлекательный попутчик, но и мудрый наставник, то вы хоть раз задумывались о том, чтобы сберечь ее на будущее. Оцифровка бумажных книг имеет два несомненных преимущества: книга в электронном виде всегда под рукой, и ей очень легко делиться.

Из этого мануала вы узнаете об основных этапах создания удобной электронной версии бумажной книги с навигацией и возможностью копирования текста.

Вступление

Стоит оговориться, что в век бурной защиты авторских прав и легкой доступности литературы, изначально сверстанной в электронной форме, имеет смысл оцифровывать либо старые фундаментальные советские учебники, либо что-то действительно редкое и только для личного пользования.

Имея доступ к старым техническим справочникам, я иногда безвозмездно помогал тем незнакомым мне людям, которым так не хватало хороших источников знаний для обучения. И коль уж я подряжался, хотелось выполнить свою работу на достаточно высоком уровне, чтобы читателю книги было приятно в нее погружаться.

Этап 1. Копирование книги

Со временем многие процессы упрощаются. Если с пяток лет назад этот этап был крайне продолжительным (приходилось пользоваться сканером), то с улучшением камер мобильных телефонов затрачиваемое время существенно сократилось. Конечно, камера камере рознь, но, если подобрать приемлемые условия съемки, должен подойти любой более-менее современный телефон.

Разумеется, использование сканера все же более предпочтительно. Особенно если дело касается технической литературы, содержащей множество формул и чертежей.

Предвосхищая события, отмечу, что снимки впоследствии будут обработаны специальной программой. Но все же стоит добросовестно отнестись к самой съемке, дабы не ставить качество конечного продукта в зависимость лишь от постобработки.

Пример не самого хорошего снимка: освещение страдает, страницы до конца не распрямлены. Все ради эксперимента.
Пример не самого хорошего снимка: освещение страдает, страницы до конца не выпрямлены. Все ради эксперимента

?????????????

Поэтому постарайтесь максимально широко раскрывать страницы, чтобы изгибы у корешка книги были минимальны. Было бы здорово, если бы вам кто-то в этом помогал. Один человек держит телефон, а второй переворачивает и выпрямляет страницы. Ко всему прочему, студенты любят делать на библиотечных книгах пометки, и неплохо было бы их стереть.

Делаем серию снимков и перекидываем их на компьютер в отдельную папку. Пришла пора поработать неживому мозгу.

Этап 2. Обработка

Я сталкивался с двумя серьезными программами для обработки отсканированных (сфотографированных) книг: ScanTailor и ScanKromsator. Возможно, за годы моего инактива появились еще какие-то достойные альтернативы, но я сомневаюсь — уж очень мала и бедна пользовательская ниша. Самые прожженные книгоделы предпочитают ScanKromsator. В нем предельно много настроек и возможностей, но разобраться и понять все предложенные навороты, видимо, не в состоянии и сам автор программы (шутка). Поэтому я рекомендую вам ScanTailor. Мне довелось следить за развитием этой утилиты с первых дней ее существования. Разработчик еще несколько лет назад прекратил поддержку проекта, но все-таки дал миру хороший инструмент для обработки сканов.

Начало работы

Работа в ScanTailor последовательна и проста. Все промежуточные действия отображены в левой части рабочей области, вы с легкостью вольетесь в процесс.

Выберите папку с исходниками, выходная папка будет создана автоматически. Для всех страниц установите максимально возможное DPI — 600 × 600. Мощности современных компьютеров позволяют достаточно быстро обрабатывать такие изображения.

ScanTailor_pic1
Не жалейте DPI для своей книги

Шаг 1. Исправление ориентации

Самый простой и быстрый шаг. Скорее всего, вы изначально фотографировали страницы с верной ориентацией, потому и хлопот возникнуть не должно. Отмечу лишь, что изначально ScanTailor будет предлагать вам запустить пакетную обработку текущего действия (небольшой значок Play напротив шага) — обязательно им пользуйтесь, дабы не щелкать по каждому изображению отдельно.

ScanTailor_pic2
На мой взгляд, ScanTailor может гордиться своим продуманным интерфейсом

Шаг 2. Разрезка страниц

Практически беспроблемный шаг. Я крайне редко встречал ошибки программы на этом этапе. Обязательно обратите внимание на обложку книги — именно здесь зачастую возникают нюансы.

ScanTailor_pic3
Большей наглядности и придумать трудно

Шаг 3. Компенсация наклона

В подавляющем большинстве случаев алгоритм срабатывает корректно. Не ждите подвоха, переходите к следующему шагу.

ScanTailor_pic4
К вашим услугам ручная настройка до долей градуса

Шаг 4. Полезная область

Наверное, это самый ответственный момент. Только содержание книги имеет определяющее значение, оформление — дело вторичное. Именно с этого шага начинает работать связка “компьютер — человек”. В программе порой случаются небольшие сбои, поэтому после автоматической обработки пробегитесь глазами по миниатюрам страниц в правой части экрана. Обычно ошибки сразу бросаются в глаза.

ScanTailor_pic5
“Бракованная” полезная область будет видна при просмотре миниатюр страниц

Шаг 5. Поля

Размер полей — дело вкуса. Более важным моментом является возможность выравнивания размеров страниц. Не забудьте поставить эту галочку, чтобы не получить на выходе “пляшущие” страницы.

ScanTailor_pic6
Обложку обычно приходится дорабатывать в графическом редакторе

Шаг 6. Выход

Последний бой — он трудный самый. Плюс самый ресурсоемкий для вашего компьютера и самый требовательный к вашему вниманию.

ScanTailor_pic7
Необработанные страницы помечаются вопросительным знаком

Финишный отрезок знаменуется рядом важнейший действий. Прежде всего вы определяете выходной режим книги: черно-белый, цветной или смешанный. Затем страницы очищаются от мусора, искривленные строки выравниваются. Не буду вдаваться в подробности, но укажу вам на не самые заметные закладки, расположенные несколько нелогично и непривычно — между превью страницы и лентой миниатюр. Каждая закладка отвечает за важную функцию ручной настройки получаемых изображений. Если вы найдете желание и время вникнуть в принцип их работы, ваши книги будут более высокого качества.

Страница до и после корректировки искажения строк
Страница до и после корректировки искажения строк

Итог

Стремясь к идеалу, на эту работу вы можете потратить не один час. Все зависит от вашей заинтересованности в конечном результате и качестве исходных снимков. Да, я еще раз возвращаюсь к этой теме. Чуть большие старания на этапе подготовки могут сэкономить огромное количество времени, которое уходит на приведение страниц в приличный вид.

Прошу не брать за образец приведенные скриншоты — на все про все у меня ушло не более пары минут. Я не сомневаюсь, что забыл указать вам на некоторые нюансы работы со ScanTailor — слишком давно я ничего не обрабатывал с его помощью.

В итоге вы получите набор разрозненных страниц в формате .tif. Пора сшиваться!

Этап 3. Создание djvu-файла

Если вы хотите быстро сварганить DjVu-файл, обратитесь за помощью к малюсенькой утилите DjVu Small. Есть и более серьезные программы, например DjVu Editor Pro. Конечно, предпочтительным видится применение второго инструмента. Но решать вам: установите обе программы и сравните их возможности.

DjVu Small

Что касается создания PDF — в Интернете есть вагон и маленькая тележка соответствующих программ и веб-сервисов.

Этап 4. Создание OCR-слоя

Одним из признанных мировых лидеров в распознавании текста несомненно является компания ABBYY с ее известным продуктом FineReader. Наверное, нет таких людей, которые не слышали об этой программе, поэтому и расписывать особо нечего. С недавнего времени FineReader умеет открывать и сохранять результаты работы прямиком в DjVu, что исключает необходимость использования промежуточного софта.

Этап 5. Создание оглавления

На просторах Сети довелось встречать положительные отзывы о программе Pdf & Djvu Bookmarker. Как становится понятно из названия, софтина умеет работать с обоими самыми распространенными форматами электронных книг.

Заключение

Скорее всего, вы не осилили много букв и сразу перешли к выводам. А они для рядового человека неутешительны. Электронное книгоиздание — дело хлопотное, полное трудностей и сюрпризов. Чтобы дослужиться даже до “зеленого пояса”, вам придется потратить кучу времени. Оцифровка бумажных книг на высоком уровне — удел энтузиастов. Если вы все же решитесь пройти чертову дюжину кругов ада, то получите непередаваемые впечатления. Всегда приятно делать что-то общественно полезное и получать за это обычные человеческие благодарности.

Но в целом рекомендую остановиться после обработки в ScanTailor, объединить разрозненные страницы в PDF и дальше не лезть в дебри.

Осознанно и бессознательно я упустил кучу мелочей и нюансов, которые подстерегут вас на пути создания хорошей электронной книги. Надеюсь, что к обсуждению в комментариях подключатся знающие люди и укажут на мои неточности или расскажут о своих секретах.

Если нашли ошибку, выделите текст и нажмите Ctrl + Enter

Лучшие предложения

Nahodki AliExpress: 20 samyh poleznyh i interesnyh tovarov oktyabrya

Находки AliExpress: 20 самых полезных и интересных товаров октября

120 idej podarkov dlya «Tajnogo Santy»

120 идей подарков для «Тайного Санты»

30 полезных товаров со скидками до 86% на AliExpress

30 полезных товаров со скидками до 86% на AliExpress

Забираем зимние кроссовки от Humtto со скидкой 55%

Забираем зимние кроссовки от Humtto со скидкой 55%

Надо брать: видеорегистратор-новинка от 70mai со скидкой 60%

Надо брать: видеорегистратор-новинка от 70mai со скидкой 60%

Это правда покупают: 10 безумных товаров с AliExpress

Это правда покупают: 10 безумных товаров с AliExpress

Смартфон realme P3 Lite 5G

Свежий бюджетник realme P3 Lite 5G отдают со скидкой 55%

самый популярный ирригатор на AliExpress

Самый популярный ирригатор на AliExpress отдают со скидкой 63%

Это интересно
«У вас плотная грудь»: что значит такое заключение врача и нужно ли его бояться

«У вас плотная грудь»: что значит такое заключение врача и нужно ли его бояться

«Задача в работе»: топ-5 популярных таск-трекеров и в чём их особенности

«Задача в работе»: топ-5 популярных таск-трекеров и в чём их особенности

Ребёнок в машине: 6 главных ошибок, которые допускают родители

Ребёнок в машине: 6 главных ошибок, которые допускают родители

Как студенты-архитекторы улучшают благоустройство городов, не отрываясь от учёбы: 4 доступных формата

Как студенты-архитекторы улучшают благоустройство городов, не отрываясь от учёбы: 4 доступных формата

Комментарии
Oleg Ivanoff
17.06.14 21:34
И все равно даже самый простой сканер даст намного лучший результат, чем фото. А если делать на хорошем офисном МФУ, то помимо еще лучшего качества можно получить готовый файл со слоем OCR "в два клика"
Avils
17.06.14 22:40
так сканер, и тем более МФУ есть намного реже чем телефон с камерой :)
Пётр Глухов
18.06.14 00:52
Еще и с драйверами запариваться не нужно.
Сергей Давлеткулов
18.06.14 08:11
На работе обычно всегда МФУ есть, а еще там есть автоподача, если книгу не жалко, можно все страницы отрезать и просканировать. Просто 300 страниц на телефон фоткать замучаешься, а еще батарея разрядиться) А если нужно 4 страницы только, то обрабатывать их зачем? пусть и хранятся как фото)
Пётр Глухов
18.06.14 00:51
Да, конечно. Видел на просторах интернета ролики о специальных чудо-сканерах, которые сами перелистывают страницы и сканируют их со страшной скоростью. Такие бы всем :)
Kirill Pogodin
22.03.22 01:52
Добрый день, Петр, вы могли бы оказать услугу по созданию электронной книги из бумажной?
Oleg Bondarenko
18.06.14 11:03
Можно также порекомендовать: Съемка. * Раскрывать страницы стеклом, положенным сверху. Источник света сбоку, чтобы не было засветки. В идеале книгу раскрывать на 90-120 градусов, но при этом каждая страница сканируется отдельно. * Желательно сделать некий упор для книги и крепеж для камеры, чтобы компоновка кадра была постоянной. Это сэкономит кучу времени и сил позже. Например, я как-то установил камеру на трипод объективом вниз, а книгу клал по краю досок паркета. * Также желателен постоянный искусственный источник рассеянного света. * Зафиксируйте экспозицию, баланс белого, фокус, зум и проч. в вашей камере, чтобы кадры не отличались по освещенности, цвету и проч. Обработка. Можно обойтись фотошопом. Если кадры получились однотипные, настроить автоматизацию. Кадры сохранять в TIFF или сразу в PDF-принтер, коих достаточно. Если совсем на коленке, помогут программы для телефона типа CamScanner. Конечно, полноценной книги так не получить, но личный справочник или одноразовое чтиво вполне.
Oleg Bondarenko
18.06.14 11:09
Кстати, пару раз видел такое чудо: банальная мыльница или просто микрокамера на жестком крепеже над столом объективом вниз. Для сканирования документов было достаточно положить их на угол стола и нажать кнопку в компьютере - результат появлялся практически сразу (если сравнить с планшетным сканнером: поднять крышку, нажать кнопку превью, дождаться прохода, настроить прараметры, сканировать в чистовую, не забыть документ в сканнере :). Искал в продаже, видимо, плохо.
Пётр Глухов
18.06.14 11:10
Большое спасибо за дельные советы.
Сергей Аверин
18.06.14 17:49
Есть более легкий способ оцифровки, но к сожалению с потерей оригинала. Берется МФУ с автозагрузкой и двусторонним сканированием. книга расшивается и загружается в лоток. За пару минут вся книга есть в цыфровом виде.
Alex Dzerzhinsky
18.06.14 18:46
У приведенного способа есть один большой плюс - он меньше влияет на состояние книги. Для текущей литературы это неактуально, конечно же, но для старой - очень даже. У меня есть несколько книг начала 20-го века, когда меня попросили снять копию, пришлось именно фотоаппаратом переснимать, потому что сканирование планшетным сканером книга бы не пережила.
Глеб Ростовцев
18.06.14 21:07
Google goggles - 2 слова создающие текст из фотографии текста!
Artemov Andrey
20.06.14 15:03
Спасибо, для меня полезная статья!
Амин Ахмадов
28.03.17 06:35
ребят скиньте пожалуйста литературу про создание электронную копию бумажной книги, а так же историю кто первым сделал и за чем
Ostap Bender
23.11.17 08:54
Спасибо зачетная работа!
Владимир Стрелец
15.02.20 21:56
Телеграмм вам в помощь с прекрасным ботом в котором можно скачать любую электронную книгу Пользуюсь уже несколько месяцев и доволен как слон Любые новинки сразу у меня и бесплатно Ранее очень мало читал, а теперь зачитываюсь даже на работе ))
Alex Ponomar
15.02.20 22:17
Воровать – плохо.
Sergei M
15.02.20 22:31
Спасибо за подсказку! Действительно нашёл нужную книгу по Вашей наводке.
Kirill Pogodin
22.03.22 02:01
Петр, спасибо за статью! Вы могли бы оказать услугу по созданию электронной книги из бумажной? Заранее спасибо!
Что вы могли пропустить
Как почистить кулер для воды в домашних условиях
Как почистить кулер для воды в домашних условиях
0
Вчера
Ликбез
Советы
Правда ли контейнер пылесоса надо чистить сразу после уборки
Правда ли контейнер пылесоса надо чистить сразу после уборки
0
25 октября
Советы
Советы
Как отличить хрусталь от стекла
Как отличить хрусталь от стекла
0
24 октября
Ликбез
Советы
Как избавиться от запаха канализации
Как избавиться от запаха канализации
0
18 октября
Ликбез
Советы
3 вопроса, чтобы расхламить шкаф с одеждой без лишних усилий
3 вопроса, чтобы расхламить шкаф с одеждой без лишних усилий
0
12 октября
Советы
Советы
Нейлон или полиэстер — что лучше для куртки
Нейлон или полиэстер — что лучше для куртки
0
11 октября
Ликбез
Советы
Как это сделать: научить ребёнка говорить «нет» незнакомцам в интернете
Как это сделать: научить ребёнка говорить «нет» незнакомцам в интернете
0
7 октября
Советы
Советы
Как выбрать одеяло для комфортного сна
Как выбрать одеяло для комфортного сна
0
4 октября
Ликбез
Советы
Где растёт клюква и когда её собирать
Где растёт клюква и когда её собирать
0
30 сентября
Ликбез
Советы
Как защитить ребёнка в интернете: 3 совета для дальновидных родителей
Как защитить ребёнка в интернете: 3 совета для дальновидных родителей
0
30 сентября
Советы
Советы
Apple объяснила царапины на iPhone 17 Pro: это не дефект, а следы от MagSafe-стойки
Apple объяснила царапины на iPhone 17 Pro: это не дефект, а следы от MagSafe-стойки
0
25 сентября
Новости
Советы
Чем отмыть руки от грецкого ореха
Чем отмыть руки от грецкого ореха
0
23 сентября
Ликбез
Советы
О чём стоит знать до рождения ребёнка? Рассказывают опытные родители
О чём стоит знать до рождения ребёнка? Рассказывают опытные родители
0
17 сентября
Советы
Советы
Вышел трейлер фильма «Дорогая, я уменьшаюсь» — про человека, который становится меньше спичечного коробка
Вышел трейлер фильма «Дорогая, я уменьшаюсь» — про человека, который становится меньше спичечного коробка
0
16 сентября
Советы
Советы
Как пользоваться посудомоечной машиной правильно
Как пользоваться посудомоечной машиной правильно
0
13 сентября
Ликбез
Советы

Новые комментарии

Аватар автора комментария
Amir Gizeev52 минуты назад

0 / 0

Титаник утонул, похоже и камера такая же утопленная и из-за естественных водных причин предмета в воде утопленика, сильно распиарена с задраной ценой. Овчинка выделки не стоит .
Надо брать: видеорегистратор-новинка от 70mai со скидкой 60%
Аватар автора комментария
S G1 час назад

0 / 0

посмотрел недавно Эддингтон хоакина феникса - челу явно нравится сниматься в артхаусном шлаке, а вы его вовсю пиарите
10 недооценённых фильмов студии A24, которые вы могли пропустить
Аватар автора комментария
Роман Комиссаров1 час назад

0 / 0

Если пойдет такая тенденция по чаевым,то в общепите будут работать только неликвиды.С момента организации ресторанного бизнеса зп официантов большей частью состоит из чаевых.А каменное лицо у него,скорее всего,что он рысачил,а ему фигу оставили. Вот и дорабатывает без настроения.Может такое быть?
«Коплю на мечту»: почему ненормально просить чаевые за любую работу — особенно за кофе
Аватар автора комментария
Anna Nikolaevna2 часа назад

0 / 0

Даже Санлайт и Валберис тоже цыганят деньги. Вам понравилось обслуживание? Извините, я на Валберис, только потому, что не хочу переплачивать. Я получаю не €150.000 и не $. Мне не дали эти деньги просто, соцслужбы, я их заработала. Чаевые мне не платят. За все до копейки заплачены налог. Зарплата минималка + если начальница подбросит премию. Пора уходить от этой западной манере с чаевыми, или нам надо начинать платить в тысячах долларов.
«Коплю на мечту»: почему ненормально просить чаевые за любую работу — особенно за кофе
Задача — дойти до школы самому: как подготовить ребёнка и убедиться, что всё будет в порядке 

Задача — дойти до школы самому: как подготовить ребёнка и убедиться, что всё будет в порядке  

Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииДля начинающих авторов
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях