Автор: / Дата: в 7:00 Рубрика: Интернет Комментариев нет

Архив сайтов интернета

Архив сайтов интернета

Добрый день. Хотели бы вы посмотреть, как выглядел любимый сайт 5 лет назад? А 10? А 20? Такая возможность есть! Помнится, были шутки из разряда: “Решил весь интернет скачать?”. А вот одна компания взяла и сделала это в 1996 году. И продолжает делать по сей день. Как пишут они сами, база содержит уже 484 миллиарда сохраненных страниц. Получается своеобразный архив сайтов интернета. А вот и он.

Он также может пригодиться, если у вас в закладках был какой-то сайт с нужными вам статьями, но вы обнаружили, что он больше не работает.

Конечно, можно найти некоторые вещи в сохраненных страницах yandex или google, но хранятся они там весьма недолго, в отличие от archive.org.

Ресурс помимо сохраненных страниц также содержит архив музыки, видео, книг и многое другое. Это вы можете увидеть, как только зайдете в этот онлайн-архив. Если же интересуют именно сайты, то нужный нам инструмент расположен в самом верху – Wayback Machine (машина времени).

Wayback machine

 

Как это работает

С определенной периодичностью, известной одним только администраторам ресурса, делаются “снимки” разных онлайн-ресурсов. При этом некоторые из них могут не попасть в архив, если администратор архивируемой страницы запретит это. При создании снимка, доступной для просмотра становится не только главная страница какого-либо сайта, но и внутренние ссылки. То есть по архиву из прошлого можно спокойно “гулять”. Ну или почти спокойно. Все таки сохраняется не абсолютно всё.

Вводим в адресную строку интересующий нас ресурс. Я решил посмотреть на Яндекс из прошлого. Откроется календарь, с подсвеченными синими кружочками датами.

Интернет-архив - календарь

Каждая такая дата содержит в себе от одного до множества снимков страницы, сделанных в разное время. Щелкаем на любом из них.

Интернет-архив - календарь

Вот так выглядел Яндекс в 1998 году – один из первых снимков этого сайта. Необычно, не правда ли?

 

Яндекс из прошлого

 

Яндекс из прошлого

А вот как выглядит результат запрета на “сканирование”. В данном случае были закрыты от робота определенные страницы.

Запрет из-за robots.txt

Полный список снимков, кстати, можно также найти, введя в браузере такую строку:

http://wayback.archive.org/web/*/yandex.ru*

Подставьте вместо яндекса интересующий вас ресурс, и получите такую картину.

Wayback machine - поиск

Особенностью этого режима считается поиск, расположенный справа-сверху. Если, к примеру, вы хотите найти все картинки сайта, введите туда .jpg. Если все текстовые документы – .txt, и так далее.

Вот так можно найти очень и очень много интересного. И если какой-то онлайн ресурс когда-то был создан, то интернет помнит все. Используйте эту библиотеку, ищите то, что вас интересует. А в будущем мы рассмотрим другие интересности из мира Интернета. Удачи!

В заключение еще раз приведу ссылку на этот ресурс:
archive.org/web
 

С уважением, Артём Гурьянов.

Хочешь получать статьи этого блога на почту?
Комментариев нет

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: