Лайфхакер
Лайфхакер
Лучшее
Новости
Жизнь
Рецепты
Здоровье
Кино
Технологии
Покупки
Лучшее
Новости
Жизнь
Рецепты
Здоровье
Кино
Технологии
Покупки
Бежим с Лайфхакером
Добрые новости
Стыдные вопросы
Есть мнение
Норм или стрём
Личный опыт
Объясняем за минуту
Сервисы
Сделай самСоветы
17 июня 2014

Как сделать электронную копию бумажной книги

Решили сделать копию бумажной книги в электронном формате DjVu или PDF? Узнайте, через какие трудности вам придется пройти и какой софт при этом пригодится.
Фото автора Пётр Глухов
Пётр Глухов

Как сделать электронную копию бумажной книги

Что для вас значит книга? Если это не просто увлекательный попутчик, но и мудрый наставник, то вы хоть раз задумывались о том, чтобы сберечь ее на будущее. Оцифровка бумажных книг имеет два несомненных преимущества: книга в электронном виде всегда под рукой, и ей очень легко делиться.

Из этого мануала вы узнаете об основных этапах создания удобной электронной версии бумажной книги с навигацией и возможностью копирования текста.

Вступление

Стоит оговориться, что в век бурной защиты авторских прав и легкой доступности литературы, изначально сверстанной в электронной форме, имеет смысл оцифровывать либо старые фундаментальные советские учебники, либо что-то действительно редкое и только для личного пользования.

Имея доступ к старым техническим справочникам, я иногда безвозмездно помогал тем незнакомым мне людям, которым так не хватало хороших источников знаний для обучения. И коль уж я подряжался, хотелось выполнить свою работу на достаточно высоком уровне, чтобы читателю книги было приятно в нее погружаться.

Этап 1. Копирование книги

Со временем многие процессы упрощаются. Если с пяток лет назад этот этап был крайне продолжительным (приходилось пользоваться сканером), то с улучшением камер мобильных телефонов затрачиваемое время существенно сократилось. Конечно, камера камере рознь, но, если подобрать приемлемые условия съемки, должен подойти любой более-менее современный телефон.

Разумеется, использование сканера все же более предпочтительно. Особенно если дело касается технической литературы, содержащей множество формул и чертежей.

Предвосхищая события, отмечу, что снимки впоследствии будут обработаны специальной программой. Но все же стоит добросовестно отнестись к самой съемке, дабы не ставить качество конечного продукта в зависимость лишь от постобработки.

Пример не самого хорошего снимка: освещение страдает, страницы до конца не распрямлены. Все ради эксперимента.
Пример не самого хорошего снимка: освещение страдает, страницы до конца не выпрямлены. Все ради эксперимента

?????????????

Поэтому постарайтесь максимально широко раскрывать страницы, чтобы изгибы у корешка книги были минимальны. Было бы здорово, если бы вам кто-то в этом помогал. Один человек держит телефон, а второй переворачивает и выпрямляет страницы. Ко всему прочему, студенты любят делать на библиотечных книгах пометки, и неплохо было бы их стереть.

Делаем серию снимков и перекидываем их на компьютер в отдельную папку. Пришла пора поработать неживому мозгу.

Этап 2. Обработка

Я сталкивался с двумя серьезными программами для обработки отсканированных (сфотографированных) книг: ScanTailor и ScanKromsator. Возможно, за годы моего инактива появились еще какие-то достойные альтернативы, но я сомневаюсь — уж очень мала и бедна пользовательская ниша. Самые прожженные книгоделы предпочитают ScanKromsator. В нем предельно много настроек и возможностей, но разобраться и понять все предложенные навороты, видимо, не в состоянии и сам автор программы (шутка). Поэтому я рекомендую вам ScanTailor. Мне довелось следить за развитием этой утилиты с первых дней ее существования. Разработчик еще несколько лет назад прекратил поддержку проекта, но все-таки дал миру хороший инструмент для обработки сканов.

Начало работы

Работа в ScanTailor последовательна и проста. Все промежуточные действия отображены в левой части рабочей области, вы с легкостью вольетесь в процесс.

Выберите папку с исходниками, выходная папка будет создана автоматически. Для всех страниц установите максимально возможное DPI — 600 × 600. Мощности современных компьютеров позволяют достаточно быстро обрабатывать такие изображения.

ScanTailor_pic1
Не жалейте DPI для своей книги

Шаг 1. Исправление ориентации

Самый простой и быстрый шаг. Скорее всего, вы изначально фотографировали страницы с верной ориентацией, потому и хлопот возникнуть не должно. Отмечу лишь, что изначально ScanTailor будет предлагать вам запустить пакетную обработку текущего действия (небольшой значок Play напротив шага) — обязательно им пользуйтесь, дабы не щелкать по каждому изображению отдельно.

ScanTailor_pic2
На мой взгляд, ScanTailor может гордиться своим продуманным интерфейсом

Шаг 2. Разрезка страниц

Практически беспроблемный шаг. Я крайне редко встречал ошибки программы на этом этапе. Обязательно обратите внимание на обложку книги — именно здесь зачастую возникают нюансы.

ScanTailor_pic3
Большей наглядности и придумать трудно

Шаг 3. Компенсация наклона

В подавляющем большинстве случаев алгоритм срабатывает корректно. Не ждите подвоха, переходите к следующему шагу.

ScanTailor_pic4
К вашим услугам ручная настройка до долей градуса

Шаг 4. Полезная область

Наверное, это самый ответственный момент. Только содержание книги имеет определяющее значение, оформление — дело вторичное. Именно с этого шага начинает работать связка “компьютер — человек”. В программе порой случаются небольшие сбои, поэтому после автоматической обработки пробегитесь глазами по миниатюрам страниц в правой части экрана. Обычно ошибки сразу бросаются в глаза.

ScanTailor_pic5
“Бракованная” полезная область будет видна при просмотре миниатюр страниц

Шаг 5. Поля

Размер полей — дело вкуса. Более важным моментом является возможность выравнивания размеров страниц. Не забудьте поставить эту галочку, чтобы не получить на выходе “пляшущие” страницы.

ScanTailor_pic6
Обложку обычно приходится дорабатывать в графическом редакторе

Шаг 6. Выход

Последний бой — он трудный самый. Плюс самый ресурсоемкий для вашего компьютера и самый требовательный к вашему вниманию.

ScanTailor_pic7
Необработанные страницы помечаются вопросительным знаком

Финишный отрезок знаменуется рядом важнейший действий. Прежде всего вы определяете выходной режим книги: черно-белый, цветной или смешанный. Затем страницы очищаются от мусора, искривленные строки выравниваются. Не буду вдаваться в подробности, но укажу вам на не самые заметные закладки, расположенные несколько нелогично и непривычно — между превью страницы и лентой миниатюр. Каждая закладка отвечает за важную функцию ручной настройки получаемых изображений. Если вы найдете желание и время вникнуть в принцип их работы, ваши книги будут более высокого качества.

Страница до и после корректировки искажения строк
Страница до и после корректировки искажения строк

Итог

Стремясь к идеалу, на эту работу вы можете потратить не один час. Все зависит от вашей заинтересованности в конечном результате и качестве исходных снимков. Да, я еще раз возвращаюсь к этой теме. Чуть большие старания на этапе подготовки могут сэкономить огромное количество времени, которое уходит на приведение страниц в приличный вид.

Прошу не брать за образец приведенные скриншоты — на все про все у меня ушло не более пары минут. Я не сомневаюсь, что забыл указать вам на некоторые нюансы работы со ScanTailor — слишком давно я ничего не обрабатывал с его помощью.

В итоге вы получите набор разрозненных страниц в формате .tif. Пора сшиваться!

Этап 3. Создание djvu-файла

Если вы хотите быстро сварганить DjVu-файл, обратитесь за помощью к малюсенькой утилите DjVu Small. Есть и более серьезные программы, например DjVu Editor Pro. Конечно, предпочтительным видится применение второго инструмента. Но решать вам: установите обе программы и сравните их возможности.

DjVu Small

Что касается создания PDF — в Интернете есть вагон и маленькая тележка соответствующих программ и веб-сервисов.

Этап 4. Создание OCR-слоя

Одним из признанных мировых лидеров в распознавании текста несомненно является компания ABBYY с ее известным продуктом FineReader. Наверное, нет таких людей, которые не слышали об этой программе, поэтому и расписывать особо нечего. С недавнего времени FineReader умеет открывать и сохранять результаты работы прямиком в DjVu, что исключает необходимость использования промежуточного софта.

Этап 5. Создание оглавления

На просторах Сети довелось встречать положительные отзывы о программе Pdf & Djvu Bookmarker. Как становится понятно из названия, софтина умеет работать с обоими самыми распространенными форматами электронных книг.

Заключение

Скорее всего, вы не осилили много букв и сразу перешли к выводам. А они для рядового человека неутешительны. Электронное книгоиздание — дело хлопотное, полное трудностей и сюрпризов. Чтобы дослужиться даже до “зеленого пояса”, вам придется потратить кучу времени. Оцифровка бумажных книг на высоком уровне — удел энтузиастов. Если вы все же решитесь пройти чертову дюжину кругов ада, то получите непередаваемые впечатления. Всегда приятно делать что-то общественно полезное и получать за это обычные человеческие благодарности.

Но в целом рекомендую остановиться после обработки в ScanTailor, объединить разрозненные страницы в PDF и дальше не лезть в дебри.

Осознанно и бессознательно я упустил кучу мелочей и нюансов, которые подстерегут вас на пути создания хорошей электронной книги. Надеюсь, что к обсуждению в комментариях подключатся знающие люди и укажут на мои неточности или расскажут о своих секретах.

Если нашли ошибку, выделите текст и нажмите Ctrl + Enter
Это интересно
Это что-то с чем-то: 5 продуктов из «ВкусВилла», которые вы не найдёте в масс-маркете

Это что-то с чем-то: 5 продуктов из «ВкусВилла», которые вы не найдёте в масс-маркете

Мас-рестлинг, хуреш и ещё 5 необычных национальных видов спорта России

Мас-рестлинг, хуреш и ещё 5 необычных национальных видов спорта России

Как обновить квартиру: 6 простых шагов к свободному пространству и уютному дому

Как обновить квартиру: 6 простых шагов к свободному пространству и уютному дому

7 мифов об уколах для похудения

7 мифов об уколах для похудения

Комментарии
Oleg Ivanoff
17.06.14 21:34
И все равно даже самый простой сканер даст намного лучший результат, чем фото. А если делать на хорошем офисном МФУ, то помимо еще лучшего качества можно получить готовый файл со слоем OCR "в два клика"
Avils
17.06.14 22:40
так сканер, и тем более МФУ есть намного реже чем телефон с камерой :)
Пётр Глухов
18.06.14 00:52
Еще и с драйверами запариваться не нужно.
Сергей Давлеткулов
18.06.14 08:11
На работе обычно всегда МФУ есть, а еще там есть автоподача, если книгу не жалко, можно все страницы отрезать и просканировать. Просто 300 страниц на телефон фоткать замучаешься, а еще батарея разрядиться) А если нужно 4 страницы только, то обрабатывать их зачем? пусть и хранятся как фото)
Пётр Глухов
18.06.14 00:51
Да, конечно. Видел на просторах интернета ролики о специальных чудо-сканерах, которые сами перелистывают страницы и сканируют их со страшной скоростью. Такие бы всем :)
Kirill Pogodin
22.03.22 01:52
Добрый день, Петр, вы могли бы оказать услугу по созданию электронной книги из бумажной?
Oleg Bondarenko
18.06.14 11:03
Можно также порекомендовать: Съемка. * Раскрывать страницы стеклом, положенным сверху. Источник света сбоку, чтобы не было засветки. В идеале книгу раскрывать на 90-120 градусов, но при этом каждая страница сканируется отдельно. * Желательно сделать некий упор для книги и крепеж для камеры, чтобы компоновка кадра была постоянной. Это сэкономит кучу времени и сил позже. Например, я как-то установил камеру на трипод объективом вниз, а книгу клал по краю досок паркета. * Также желателен постоянный искусственный источник рассеянного света. * Зафиксируйте экспозицию, баланс белого, фокус, зум и проч. в вашей камере, чтобы кадры не отличались по освещенности, цвету и проч. Обработка. Можно обойтись фотошопом. Если кадры получились однотипные, настроить автоматизацию. Кадры сохранять в TIFF или сразу в PDF-принтер, коих достаточно. Если совсем на коленке, помогут программы для телефона типа CamScanner. Конечно, полноценной книги так не получить, но личный справочник или одноразовое чтиво вполне.
Oleg Bondarenko
18.06.14 11:09
Кстати, пару раз видел такое чудо: банальная мыльница или просто микрокамера на жестком крепеже над столом объективом вниз. Для сканирования документов было достаточно положить их на угол стола и нажать кнопку в компьютере - результат появлялся практически сразу (если сравнить с планшетным сканнером: поднять крышку, нажать кнопку превью, дождаться прохода, настроить прараметры, сканировать в чистовую, не забыть документ в сканнере :). Искал в продаже, видимо, плохо.
Пётр Глухов
18.06.14 11:10
Большое спасибо за дельные советы.
Сергей Аверин
18.06.14 17:49
Есть более легкий способ оцифровки, но к сожалению с потерей оригинала. Берется МФУ с автозагрузкой и двусторонним сканированием. книга расшивается и загружается в лоток. За пару минут вся книга есть в цыфровом виде.
Alex Dzerzhinsky
18.06.14 18:46
У приведенного способа есть один большой плюс - он меньше влияет на состояние книги. Для текущей литературы это неактуально, конечно же, но для старой - очень даже. У меня есть несколько книг начала 20-го века, когда меня попросили снять копию, пришлось именно фотоаппаратом переснимать, потому что сканирование планшетным сканером книга бы не пережила.
Глеб Ростовцев
18.06.14 21:07
Google goggles - 2 слова создающие текст из фотографии текста!
Artemov Andrey
20.06.14 15:03
Спасибо, для меня полезная статья!
Амин Ахмадов
28.03.17 06:35
ребят скиньте пожалуйста литературу про создание электронную копию бумажной книги, а так же историю кто первым сделал и за чем
Ostap Bender
23.11.17 08:54
Спасибо зачетная работа!
Владимир Стрелец
15.02.20 21:56
Телеграмм вам в помощь с прекрасным ботом в котором можно скачать любую электронную книгу Пользуюсь уже несколько месяцев и доволен как слон Любые новинки сразу у меня и бесплатно Ранее очень мало читал, а теперь зачитываюсь даже на работе ))
Alex Ponomar
15.02.20 22:17
Воровать – плохо.
Sergei M
15.02.20 22:31
Спасибо за подсказку! Действительно нашёл нужную книгу по Вашей наводке.
Kirill Pogodin
22.03.22 02:01
Петр, спасибо за статью! Вы могли бы оказать услугу по созданию электронной книги из бумажной? Заранее спасибо!
Что вы могли пропустить
15 бытовых устройств, которые выгоднее взять в аренду или купить совместно с друзьями 
15 бытовых устройств, которые выгоднее взять в аренду или купить совместно с друзьями 
0
26 мая
Советы
Советы
Как правильно мыть аэрогриль
Как правильно мыть аэрогриль
0
9 мая
Ликбез
Советы
Классные способы отстирать шторы в стиральной машине и не испортить их
Классные способы отстирать шторы в стиральной машине и не испортить их
8 мая
«Горящая изба»
Советы
Я проверила 6 популярных лайфхаков с мицеллярной водой, и вот что работает на самом деле
Я проверила 6 популярных лайфхаков с мицеллярной водой, и вот что работает на самом деле
0
6 мая
Советы
Советы
Как сдерживать беспорядок в доме с помощью метода пяти вещей
Как сдерживать беспорядок в доме с помощью метода пяти вещей
0
25 апреля
Советы
Советы
7 бытовых вещей, которые стоит убрать подальше от детей и животных
7 бытовых вещей, которые стоит убрать подальше от детей и животных
0
20 апреля
Советы
Советы
Как выбрать моющий пылесос для небольшой квартиры: характеристики, на которые реально стоит смотреть
Как выбрать моющий пылесос для небольшой квартиры: характеристики, на которые реально стоит смотреть
17 апреля
«Горящая изба»
Советы
Как пользоваться моющим пылесосом правильно
Как пользоваться моющим пылесосом правильно
0
10 апреля
Ликбез
Советы
Отличные способы покрасить яйца на Пасху, которые работают из года в год
Отличные способы покрасить яйца на Пасху, которые работают из года в год
9 апреля
«Горящая изба»
Советы
В Азии обнаружили неизвестную популяцию древних людей, пережившую ледниковый период
В Азии обнаружили неизвестную популяцию древних людей, пережившую ледниковый период
0
6 апреля
Новости
Советы
Как пользоваться пипидастром
Как пользоваться пипидастром
0
3 апреля
Ликбез
Советы
Как это сделать: превратить упаковку «Золотого яблока» в полезные вещи для дома
Как это сделать: превратить упаковку «Золотого яблока» в полезные вещи для дома
0
2 апреля
Советы
Советы
18 вещей в доме, которые только зря занимают место. Большой чек-лист расхламления на весну
18 вещей в доме, которые только зря занимают место. Большой чек-лист расхламления на весну
1 апреля
«Горящая изба»
Советы
6 способов использовать лимонную кислоту в быту
6 способов использовать лимонную кислоту в быту
0
27 марта
Советы
Советы
Как найти квартиру мечты на Яндекс Недвижимости: 3 совета для общения с ИИ-помощником
Как найти квартиру мечты на Яндекс Недвижимости: 3 совета для общения с ИИ-помощником
0
26 марта
Советы
Советы

Новые комментарии

Аватар автора комментария
Максим Лебедь42 минуты назад

0 / 0

Уминя для этого стоит фат сервер люблю :)
Tappin - обмен файлами без ограничений
Аватар автора комментария
Беларус Беларусович1 час назад

0 / 0

> Рейтинг представлен не как его личная подборка любимых лент, а как редакционный топ. > 1. «Поющие под дождём» (Singin’ in the Rain, 1951). Ясно, пойду посру (с)
The Telegraph составил рейтинг 50 лучших фильмов в истории
Аватар автора комментария
Наталья Копылова2 часа назад

0 / 0

У меня чувствительная кожа, так что я аккуратно очень меняю уход, но в последнее время дурацкий тикток провоцирует меня на трату денег на косметику, и я тоже начала скармливать составы нейронкам. Это удобно, даже если в целом ориентируешься в компонентах, потому что ИИ разбивает их по группам, отдельно подсвечивает потенциально раздражающие компоненты и всё такое. Одна из лучших приблуд, что ИИ пылесосит площадки типа реддита и такой: "ну вот тут пользователь говорят, что даже для чувствительной кожи зашибись". Короче, почитал отзывы за нас и достал оттуда полезное. Очень богоугодно с его стороны.
Как я заставила ChatGPT разобрать уходовую косметику и перестала перегружать кожу
Аватар автора комментария
Рафаэль Галиев2 часа назад

0 / 0

Тем временем, Госкино продолжает мешать с грязью моё детство...
«Ребята, давайте жить дружно!»: про кота Леопольда снимут полнометражный фильм
Как начать карьеру в телекоме: 3 реальные истории от сотрудников Т2

Как начать карьеру в телекоме: 3 реальные истории от сотрудников Т2

Реклама
Лайфхакер
Информация
О проектеРубрикиРекламаРедакцияВакансииО компании
Подписка
TelegramВКонтактеTwitterViberYouTubeИнициалRSS
Правила
Пользовательское соглашениеПолитика обработки персональных данныхПравила применения рекомендательных технологийПравила сообществаСогласие на обработку персональных данныхСогласие для рекламных рассылокСогласие для информационной программы
18+Копирование материалов запрещено.
Издание может получать комиссию от покупки товаров, представленных в публикациях