Архив Интернета

Архив Интернета

Интернет – среда, меняющаяся чрезвычайно быстро, страницы открываются и исчезают, их содержимое тоже непостоянно. Что делать, если вам нужна информация, ссылка на которую уже устарела? Только одно – посетить специальный сайт, своеобразный архив Интернета (http://www.archive.org) (рис. 4.13).

Безусловно, создать точную копию всех сайтов, существовавших когда-либо в виртуальном пространстве, просто нереально. Однако время от времени отслеживать обновления, а главное, не дать исчезнуть вовсе тем сайтам, которые по разным причинам перестали существовать, – вот основная задача архива Интернета.

Сервис, называемый The Internet Archive Wayback Machine, позволяет просматривать заархивированные версии сайтов Сети, в том числе за определенный промежуток времени.

Архив Интернета был основан в 1996 году Брюстером Кейлом (Brewster Kahle), который работает в тесном сотрудничестве с Библиотекой Конгресса США.

В декабре 2000 года Конгресс США выделил Библиотеке Конгресса $100 млн для разработки национальной программы сохранения цифровой информации. Помимо оплаты хранения, эти деньги пойдут и на научные исследования стабильности цифровых носителей. За долгие годы человечество научилось хранить бумажные материалы и знает все об их сохранности и долговечности. С цифровыми данными все иначе. В первые годы существования компьютеров люди предполагали, что цифровые данные смогут храниться без потерь десятилетиями. Однако сотрудники архивов уже заявляют, что магнитные пленки и гибкие диски, на которых хранится информация, выходят из строя.

Рис. 4.13. Архив Интернета содержит копии всех сайтов

Кроме того, цифровые носители постоянно меняются, как меняются и аппаратные средства для их воспроизведения. Сейчас многие библиотеки и архивы являются обладателями больших собраний музыкальных и иных компакт-дисков, а также DVD, которые тоже стареют год от года.

Не стоит на месте и программное обеспечение, что приводит к появлению большого количества разных форматов, не всегда совместимых между собой. Поэтому специалисты архивного дела стараются хранить данные в таких стандартных форматах, как HTML и ASCII.

Немного статистики: объем накопленной в архиве информации измеряется в PB (petabyte), а растет со скоростью 20 Тбайт в месяц. Архив обновляется каждые два месяца. Архив Интернета планирует переписывать собираемые материалы на новые носители каждые пять лет, чтобы предотвратить потерю данных.

Кроме этого, совместно с архивом Интернета работает специальная поисковая машина Wayback Machine, которая позволяет путешествовать в прошлое Интернета и отыскивать сайты, которых уже не существует.

В качестве базы для поиска Wayback Machine использует не сам Интернет, а «Архив Интернета».

Wayback Machine очень полезна для журналистов, поскольку сохраняет «снимки» электронных газет так же, как микрофильмы сохраняют старые бумажные издания. Особенно это актуально в случае электронных изданий, которые не имеют собственного архива, как, например, знаменитый Drudge Report.

Для поиска информации в архиве достаточно указать адрес сайта, в результате чего вы получите список дат, за которые в архиве сохранены его «снимки». Вы можете выбрать нужное значение и просмотреть, как выглядел сайт в определенный день.

ПРИМЕЧАНИЕ

Следует заметить, что при использовании ссылок на научные статьи, опубликованные в Интернете, часто требуют указывать ссылку именно на архив Интернета.

Данный текст является ознакомительным фрагментом.



Поделитесь на страничке

Похожие главы из других книг:

Службы Интернета

Из книги автора

Службы Интернета Представьте, что Интернет – это земной шар, где серверы представляют собой населенные пункты, а средства связи – всевозможные пути, объединяющие эти пункты. Этими путями можно пользоваться по-разному, в зависимости от поставленных целей: можно


Возможности Интернета

Из книги автора

Возможности Интернета Пусть, к примеру, вы хотите улучшить свои знания английского языка. Что вам может дать библиотека? Кипу учебников, словарей и пособий? Согласен. Давайте даже закроем глаза на то, что большинство из них доступно только в читальном зале. Действительно


14.4. Браузеры Интернета

Из книги автора

14.4. Браузеры Интернета 14.4.1 Путешествия по Интернету с помощью программы lynx Хотя большинство из нас привыкло путешествовать по WWW с помощью браузеров, работающих в графическом режиме, не стоит окончательно забывать и те программы, которые работают в текстовом. Именно


Отключение от Интернета

Из книги автора

Отключение от Интернета Как отключиться от Сети? Самый простой способ – вызвать правой кнопкой мыши контекстное меню соединения (в области уведомлений) и выбрать пункт Отключить (рис. 3.25). Рис. 3.25. Контекстное меню значка соединенияОтключиться от Интернета можно также


Архив сайтов Internet Archive Wayback Machine

Из книги автора

Архив сайтов Internet Archive Wayback Machine Электронный адрес – http://web.archive.org.Каждый, кто собирал информацию по интересующей его проблеме за достаточно длительный период, знает, как порой бывает важно найти сведения, опубликованные на сайте несколько лет назад. Иногда это просто


Информационно-аналитическая система «Семантический архив»

Из книги автора

Информационно-аналитическая система «Семантический архив» Информационно-аналитическая система «Семантический архив» разработана компанией «Аналитические бизнес решения».Она предназначена для автоматизации деятельности соответствующих служб коммерческих


Настройка интернета

Из книги автора

Настройка интернета В настоящее время существует 4 самых распространённых способа выхода в интернет: с помощью Ethernet, DSL (например, «Стрим, «Авангард»), авторизуясь через VPN (например, провайдер Corbina Telecom) и посредством Wi-Fi. Рассмотрим каждый из них.Ethernet — это технология


Архив сайтов Internet Archive Wayback Machine

Из книги автора

Архив сайтов Internet Archive Wayback Machine Очень часто нападение черных пиарщиков происходит неожиданно для вас. В таком случае вы впервые сталкиваетесь с необходимостью пристального изучения противника. В случае если вы даже предполагали подобное развитие событий (например, в


Структура Интернета

Из книги автора

Структура Интернета Интернет – это огромная компьютерная сеть. Она объединяет миллионы компьютеров во всем мире. Как только вы вышли в Интернет, моментально становитесь частью, говоря по-научному, единого информационного пространства.Чтобы получить доступ к


Браузер Интернета

Из книги автора

Браузер Интернета Знакомство с обозревателем Internet ExplorerКак вы уже знаете, для обмена данными в Интернете используется технология клиент-сервер, а доступ к определенным ресурсам осуществляется с помощью соответствующей клиентской программы. Для просмотра Web-страниц


10.6. Службы Интернета

Из книги автора

10.6. Службы Интернета Всемирная Паутина«Всемирная Паутина» – лицо современного Интернета. Появление этой службы сделало работу с информацией легкой и приятной, привлекло в ряды пользователей Сети сотни миллионов людей.Чтобы узнать новости, научиться чему-нибудь или


Что такое архив?

Из книги автора

Что такое архив? Архивы — особый вид файлов. Внутрь архива можно помещать другие файлы.Представьте, что вы взяли надувную подушку, выдавили из нее воздух и затолкали в небольшой пакет.Получится компактный сверток. Назовите его как хотите. Таким же образом в тот же мешок


Кивино гнездо: Архив-Шнархив Берд Киви

Из книги автора

Кивино гнездо: Архив-Шнархив Берд Киви Опубликовано 18 июня 2010 года В нескольких популярных блогах ученых-физиков последние недели живо обсуждалась новая и весьма занятная онлайновая забава учёных под названием snarXiv.org. Внешне этот сайт построен


Архив сертификатов

Из книги автора

Архив сертификатов На архив сертификатов возлагается функция долговременного хранения (от имени УЦ ) и защиты информации обо всех изданных сертификатах. Архив поддерживает базу данных, используемую при возникновении споров по поводу надежности электронных цифровых


Физически защищенный архив

Из книги автора

Физически защищенный архив Для базирующегося на PKI сервиса неотказуемости необходим архив (для того чтобы хранить, по крайней мере, старые копии списков САС, и, возможно, нотариально заверенные документы и другую информацию). Архив должен быть физически защищен от