Что такое Web Archive

В 1996 году американский предприниматель и активист Брюстер Кейл основал некоммерческую организацию Internet Archive («Архив интернета»). С тех пор она создаёт и хранит копии сайтов, а также книг, изображений и другого контента, который публикуется на открытых ресурсах Сети. Таким образом учредитель намерен сберечь международное культурное наследие.

Архив пополняют боты, сканирующие веб. Им помогают сотрудники и партнёры организации, среди которых множество библиотек и университетов. Кроме того, любой пользователь может загружать контент на серверы через официальный сайт организации. Содержимое архива доступно здесь же — бесплатно и для всех желающих.

Web Archive, также известный как Wayback Machine («Машина времени»), — это один из разделов на сайте Internet Archive. Здесь можно добавить новые или просмотреть уже загруженные копии веб-страниц.

Боты периодически обновляют данные. Но каждая очередная копия страницы не перезаписывает предыдущую, а сохраняется отдельно с указанием даты добавления. Поэтому с помощью Internet Archive можно посмотреть, как со временем менялись дизайн и наполнение выбранного сайта.

Web Archive: копия сайта Google
Копия сайта Google, созданная 3 декабря 2000 года

Более того, сохранённые копии остаются доступными, даже если оригинал исчезает из Сети. По этой причине Web Archive часто используют, чтобы просмотреть опубликованную информацию, которую пытаются стереть, или получить доступ к старым и уже неработающим сайтам.

С сервисом можно работать через сайт и официальное приложение Wayback Machine для iOS и Android.

Как посмотреть архивные копии страницы в Web Archive

Откройте сайт Web Archive или приложение сервиса. Если используете последнее, сразу после запуска создайте аккаунт.

Вставьте ссылку на нужную страницу и нажмите Enter (на сайте) или Overview of All Archives (в приложении).

Как пользоваться Web Archive: вставьте ссылку на нужную страницу

Пролистайте календарь, чтобы найти подходящие копии. Дни, в которые бот создавал дубликаты страницы, отмечены кружками.

Web Archive: пролистайте календарь

Нажмите на подходящую дату, чтобы просмотреть архивную копию.

Web Archive: нажмите на подходящую дату

Сайт также позволяет сравнивать две копии. Для этого на странице с календарём нажмите Changes, отметьте две даты и кликните Compare.

Web Archive: сравните две копии

В результате Web Archive отобразит копии рядом и выделит несовпадения.

Web Archive отобразит копии рядом

Как удалить копии ваших страниц из Web Archive или запретить их добавление

Если вы не желаете, чтобы копии вашего ресурса были в архиве, сообщите об этом администрации Internet Archive. Согласно официальной справке, для этого нужно отправить письмо на ящик info@archive.org, указав ссылку на свой сайт.

Скорее всего, вас попросят доказать факт владения ресурсом и объяснить причину удаления или запрета на добавление в архив. И да, писать лучше на английском.

Как добавить копию страницы в Web Archive

Чтобы не дожидаться, пока бот найдёт и сохранит нужную вам страницу, можете добавить её вручную.

Если используете сайт, перейдите в специальный подраздел. Вставьте ссылку на сохраняемую страницу и нажмите Save Page. Отметьте пункт Save error pages, если хотите, чтобы система архивировала в том числе страницы, которые не открываются из-за ошибок.

«Веб-архив»: нажмите Save Page

Если используете приложение, вставьте ссылку на нужную страницу и нажмите Archive Page Now.

Для быстрого добавления страниц можно также использовать расширения для десктопных браузеров. После установки достаточно открыть в браузере нужную ссылку, нажать на кнопку плагина и выбрать Save Page Now.

Разработчик: Internet Archive
Цена: Бесплатно
Разработчик: Team Wayback
Цена: Бесплатно
Разработчик: Разработчик
Цена: Бесплатно