Добрый день. Хотели бы вы посмотреть, как выглядел любимый сайт 5 лет назад? А 10? А 20? Такая возможность есть! Помнится, были шутки из разряда: “Решил весь интернет скачать?”. А вот одна компания взяла и сделала это в 1996 году. И продолжает делать по сей день. Как пишут они сами, база содержит уже 484 миллиарда сохраненных страниц. Получается своеобразный архив сайтов интернета. А вот и он.
Он также может пригодиться, если у вас в закладках был какой-то сайт с нужными вам статьями, но вы обнаружили, что он больше не работает.
Конечно, можно найти некоторые вещи в сохраненных страницах yandex или google, но хранятся они там весьма недолго, в отличие от archive.org.
Ресурс помимо сохраненных страниц также содержит архив музыки, видео, книг и многое другое. Это вы можете увидеть, как только зайдете в этот онлайн-архив. Если же интересуют именно сайты, то нужный нам инструмент расположен в самом верху – Wayback Machine (машина времени).
Как это работает
С определенной периодичностью, известной одним только администраторам ресурса, делаются “снимки” разных онлайн-ресурсов. При этом некоторые из них могут не попасть в архив, если администратор архивируемой страницы запретит это. При создании снимка, доступной для просмотра становится не только главная страница какого-либо сайта, но и внутренние ссылки. То есть по архиву из прошлого можно спокойно “гулять”. Ну или почти спокойно. Все таки сохраняется не абсолютно всё.
Вводим в адресную строку интересующий нас ресурс. Я решил посмотреть на Яндекс из прошлого. Откроется календарь, с подсвеченными синими кружочками датами.
Каждая такая дата содержит в себе от одного до множества снимков страницы, сделанных в разное время. Щелкаем на любом из них.
Вот так выглядел Яндекс в 1998 году – один из первых снимков этого сайта. Необычно, не правда ли?
А вот как выглядит результат запрета на “сканирование”. В данном случае были закрыты от робота определенные страницы.
Полный список снимков, кстати, можно также найти, введя в браузере такую строку:
http://wayback.archive.org/web/*/yandex.ru*
Подставьте вместо яндекса интересующий вас ресурс, и получите такую картину.
Особенностью этого режима считается поиск, расположенный справа-сверху. Если, к примеру, вы хотите найти все картинки сайта, введите туда .jpg. Если все текстовые документы – .txt, и так далее.
Вот так можно найти очень и очень много интересного. И если какой-то онлайн ресурс когда-то был создан, то интернет помнит все. Используйте эту библиотеку, ищите то, что вас интересует. А в будущем мы рассмотрим другие интересности из мира Интернета. Удачи!
В заключение еще раз приведу ссылку на этот ресурс:
archive.org/web
С уважением, Артём Гурьянов.