30 Особенности индексации документов PDF

Поисковые системы были просто вынуждены научиться индексировать файлы PDF, поскольку изначально документы данного формата ассоциировались с исключительно качественным контентом вроде докладов, отчётов, статей и пр. Что они собственно и сделали. Поэтому в плане оптимизации файлы PDF сегодня мало чем отличаются от веб-страниц в HTML.

Важно понять, что файл в формате PDF – такая же страница сайта, как и файл в формате HTML. Как и на любой HTML-странице, в PDF тоже желательно сохранять ссылки на остальные разделы сайта.

Размер документа, как это обычно бывает, сильно увеличивается, когда он дополняется картинками. А вместе с размером файла увеличивается и время его загрузки. Поэтому по-прежнему важно использовать изображения только там, где без них совсем не обойтись. На практике, чтобы файл был проиндексирован поисковыми системами, файл не может весить больше 10 Мб. Но намного лучше остальных индексируются документы с размером в пределах от 500 Кб до 1 Мб.

Разумеется, ни при каких обстоятельствах нельзя забывать о шрифтовой составляющей документа PDF. Доказано, что поисковыми системами много лучше воспринимаются стандартные шрифты: Arial, Helvetica, Times Nem Roman и пр. То же касается и кодировки документа. У поисковиков в почете все те же стандартные кодировки.