Причины существования невидимого Интернета
Причины существования невидимого Интернета
Невидимый Интернет существует в силу целого ряда причин, как технического, так и организационного характера.
Некоторые ресурсы могут быть индексированы поисковыми машинами с технической точки зрения, главное – обнаружить содержимое страницы. Некоторые виды контента не индексируются информационными системами потому, что «пауки» сознательно настроены так, чтобы игнорировать те или иные адреса.
К каким-то ресурсам доступ ограничили сами владельцы страниц.
А некоторые страницы имеют такой формат, который пока еще не поддерживается поисковыми машинами.
Вот что говорят о невидимом Интернете и причинах его существования Крис Шерман и Гэри Прайс.
Парадокс невидимого Интернета в том, что легко понять, почему он существует, но трудно точно его определить в конкретных, специфических терминах.
Невидимый Интернет трудно точно определить и классифицировать по нескольким причинам.
1. Большинство страниц невидимого Интернета могут быть проиндексированы технически, но не индексируются, потому что поисковые системы решили их не индексировать. Это очень важный момент для невидимого Интернета – что поисковики просто решили исключить из индексации страницы определенного содержания. Мы не говорим о страницах со «взрослым» содержанием или спамерских сайтах, вовсе наоборот. Большинство «невидимых» сайтов имеют высококачественный контент. Просто эти ресурсы не могут быть найдены с помощью поисковых машин общего назначения, т. к. они были заблокированы.
Есть много причин, почему так происходит. Если поисковик изменит свою политику по отношению к страницам подобного рода, то эти страницы станут частью видимого Интернета.
2. Довольно легко классифицировать сайты как часть видимого или невидимого Интернета, если посмотреть на то, каким образом они работают. Некоторые сайты используют технологию баз данных, что действительно сложно сделать поисковой машине. Это действительно невидимый Интернет. Другие сайты, однако, используют сочетание файлов, которые содержат текст и которые содержат мультимедиа, а поэтому часть из них может быть проиндексирована, а часть – нет. Такие сайты нельзя отнести четко к видимой или к невидимой части Интернета.
Некоторые сайты могут быть проиндексированы поисковыми машинами, но это не делается потому, что поисковые машины считают это непрактичным – например, по причине стоимости или потому, что данные настолько короткоживущие, что индексировать их просто бессмысленно – например, прогноз погоды, точное время прибытия конкретного самолета, совершившего посадку в аэропорту и т. п.
Мы рассмотрим каждую из основных причин существования невидимого Интернета более подробно.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКДанный текст является ознакомительным фрагментом.
Читайте также
Преимущества невидимого Интернета
Преимущества невидимого Интернета Поисковые системы удобны, поскольку позволяют проводить поиск по ключевым словам. Однако все популярные поисковики такого плана – вроде Яндекса, Гугла и Рамблера, – рассчитаны на широкую, а не целевую аудиторию.В то время как
Основные категории невидимого Интернета
Основные категории невидимого Интернета Крис Шерман и Гэри Прайс еще в 2004 г. выделили основные категории онлайновой информации, которая чаще всех остальных сведений относится к невидимому Интернету – в той или иной степени.Мы бы рекомендовали материалы, подобные
20.6. Причины верить
20.6. Причины верить В будущем операционной системы Unix много проблем. Хотели бы мы действительно изменить его?За более чем тридцатилетнюю историю мы преуспели в разрешении многих трудностей. Мы были первопроходцами лучших практических приемов программной инженерии. Мы
20.6. Причины верить
20.6. Причины верить В будущем операционной системы Unix много проблем. Хотели бы мы действительно изменить его?За более чем тридцатилетнюю историю мы преуспели в разрешении многих трудностей. Мы были первопроходцами лучших практических приемов программной инженерии. Мы
10.1.11. Проверка существования и получение размера файла
10.1.11. Проверка существования и получение размера файла Часто необходимо знать, существует ли файл с данным именем. Это позволяет выяснить метод exist? из модуля FileTest:flag = FileTest::exist?("LochNessMonster")flag = FileTest::exists?("UFO")# exists? является синонимом exist?Понятно, что такой метод не может быть
ГЛАВА 5. Цикл существования объектов
ГЛАВА 5. Цикл существования объектов В предыдущей главе мы потратили достаточно много времени на то, чтобы научиться строить пользовательские типы класса в C#. В этой главе мы выясним, как среда CLR управляет уже размешенными объектами с помощью процесса, который называется
Схема лизингового управления циклом существования САО-типов и WKO-синглетов
Схема лизингового управления циклом существования САО-типов и WKO-синглетов Вы уже видели, что WKO-типы, сконфигурированные для активизации одиночного вызова, существуют только в процессе текущего вызова метода. Поэтому WKO-типы одиночного вызова являются объектами, не
Цикл существования Web-страницы ASP.NET
Цикл существования Web-страницы ASP.NET Каждая Web-страница ASP.NET имеет свой "жизненный цикл". Когда среда выполнения ASP.NET получает входящий запрос для данного файла *. aspx, в памяти размещается соответствующий тип, производный от System.Web.UI.Page, для создания которого используется
Продажная любовь как способ существования литературы, искусства и профессионального спорта Василий Щепетнёв
Продажная любовь как способ существования литературы, искусства и профессионального спорта Василий Щепетнёв Опубликовано 06 мая 2013 Теперь уже бывшая библиотека. Сегодня в ней можно приодеться. А где взять книгу «на почитать?» Весь бульвар
ГОЛУБЯТНЯ: Бойцы невидимого
ГОЛУБЯТНЯ: Бойцы невидимого Автор: Сергей ГолубицкийСегодня работаем экспериментальную «Голубятню» — без культур-повидла. Не то чтобы образовался особый завал софта, а просто интересно поглядеть — как будет выглядеть без повидла-то! Предвижу праздник на улице гоблинов
Причины зависания
Причины зависания Причины зависания компьютера можно разделить на две большие группы: аппаратные и программные. Понятно, что чаще встречаются последние, но, как показывает практика, с первыми проще бороться. Относительно легко можно понять причину аппаратной
Что делать во имя развития литературы в свете существования пиратов, классиков и духа времени Василий Щепетнёв
Что делать во имя развития литературы в свете существования пиратов, классиков и духа времени Василий Щепетнёв Опубликовано 07 июля 2013 Предположим – только предположим! – что каждое литературное произведение обладает некой ценностью. Чтобы