Общие сведения о поисковых системах
Общие сведения о поисковых системах
Поисковые системы – это специальные серверы, которые занимаются поиском, сбором и упорядочением информации, имеющейся на просторах Интернета. Основным их назначением является обеспечение пользователей необходимой информацией в результате быстрого и удобного поиска в Сети. Поисковые машины состоят из пяти основных компонентов.
1. «Паук» (spider) – программа, предназначенная для скачивания веб-страниц. Паук работает как обыкновенный браузер и занимается поиском информации в Сети. Путешествуя по ссылкам, эта программа загружает найденные страницы на сервер поисковой системы и тем самым пополняет ее базу данных.
2. «Червяк» (crawler) – как и паук, занимается скачиванием страниц. Кроме того, он исследует обнаруженные веб-страницы и извлекает все находящиеся на них ссылки. Полученные ссылки впоследствии будут использоваться пауком для дальнейшего путешествия по Сети.
3. Индексатор (indexer) – программа, служащая для упорядочивания информации, найденной пауками. Индексатор разбивает текст документа на составляющие его слова, при этом запоминая их местонахождение, анализируя, написано слово прописными или строчными буквами, является ли оно названием документа, текстом ссылки и т. д.
4. База данных (database) – представляет собой хранилище всех обработанных данных, накопленных поисковой системой.
5. Механизм выдачи результатов (search engine) – предназначен для взаимодействия пользователя с базой данных. С ним вы постоянно будете иметь дело при поиске какой-либо информации. Именно этот механизм определяет, какие вебстраницы вам представлять в соответствии с вашим запросом.
После задания вами ключевого слова или фразы поисковая система осуществляет поиск и выдает вам результат, который представляет собой список найденных веб-страниц, соответствующих вашему запросу. Для определения порядка, в котором будет показаны документы в списке, поисковая машина применяет алгоритм ранжирования. В идеале наиболее релевантные вашему запросу страницы будут расположены в списке первыми. Однако идеальный алгоритм ранжирования не найден, поэтому каждая поисковая система использует собственный, хотя отбор результатов во всех системах основывается примерно на следующих критериях:
– наличие ключевых слов в заголовке;
– плотность ключевых слов в содержимом документа, то есть количество искомых слов в тексте веб-страницы;
– расположение ключевых слов в документе;
– стиль ключевых слов (полужирный, курсив);
– индекс цитируемости – количество ссылок, ведущих на данную веб-страницу с других страниц;
– наличие ключевого слова в имени домена или адресе страницы.
После того как вы щелкнете на ссылке одного из документов в списке, предложенном вам поисковой системой, веб-страница будет запрошена с того сервера, на котором она находится.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКДанный текст является ознакомительным фрагментом.
Читайте также
Глава 7. Оптимизация сайта и его продвижение в поисковых системах
Глава 7. Оптимизация сайта и его продвижение в поисковых системах О том, насколько важными для любого сайта являются такие факторы, как его реклама, продвижение и оптимизация, мы уже неоднократно говорили выше. Ведь сайт может считаться успешным только в том случае, если
Выбор категории сайта для регистрации в поисковых системах
Выбор категории сайта для регистрации в поисковых системах Для продолжения ввода данных нажмите кнопку
Автоматическая регистрация сайта в поисковых системах, каталогах и иных ресурсах
Автоматическая регистрация сайта в поисковых системах, каталогах и иных ресурсах Одним из главных преимуществ программы Page Promoter является возможность автоматической регистрации сайта на тысячах самых разных ресурсов (поисковые системы, каталоги, рейтинги, и т.п.). Это
Общие сведения
Общие сведения Для чего же оно вообще нужно, это дистанционное обучение? Кому оно может понадобиться? Оказывается, многим.– Наибольшее количество удаленно обучающихся составляют пользователи в возрасте от 25 до 30 лет. Для них обучение в классическом виде невозможно из-за
Формы расширенного поиска в поисковых системах
Формы расширенного поиска в поисковых системах Создатели поисковых машин понимают, что не все, кто пользуется их услугами, хотят изучать язык поисковой машины. Тем более что при всей принципиальной схожести синтаксис запросов конкретных поисковых машин отличается друг
Общие сведения
Общие сведения По своей сути группы новостей (телеконференции) представляют собой обмен письмами не с одним пользователем, а сразу с группой с помощью специальной программы. Впрочем, мы ничего специального искать не будем, так как работать с группами новостей нам поможет
Формы расширенного поиска в поисковых системах
Формы расширенного поиска в поисковых системах Создатели поисковых машин понимают, что не все их пользователи хотят изучать язык поисковой машины. Тем более, что при всей принципиальной схожести синтаксис запросов конкретных поисковых машин специфичен, а к некоторым
Анонсирование в поисковых системах
Анонсирование в поисковых системах По содержанию Internet представляет собой кладезь информации, а по способу ее организации – огромную свалку. Но, к счастью, положение не столь безнадежно – найти необходимую информацию помогают каталоги и поисковые машины.Работа
Регистрация в поисковых системах
Регистрация в поисковых системах Мало разместить сайт в Интернете, необходимо еще зарегистрировать его в известных поисковиках, чтобы они включили его в свой поиск. Не огорчайтесь, если ваш сайт не сразу будет виден в поиске. Некоторые поисковики специально консервируют
Общие сведения
Общие сведения Главная страница, посвященная .NET Compact Framework, находится по адресу http://msdn.microsoft.com/netframework/programming/netcf/default.aspx. Там можно найти все последние новости о рассматриваемой технологии, обновления программ, ссылки на другие полезные сайты, примеры.Технология .NET Compact
Общие сведения
Общие сведения Во-первых, рассмотрим ключевые понятия. Архивация (запаковка) – это сжатие файлов. Для окончательного усваивания этого понятия представьте себе поролоновую губку – она с виду большая, но ее можно сжать и запихнуть в емкость гораздо меньшего объема. Архив
Общие сведения
Общие сведения Система PascalABC.NET PascalABC.NET – это система программирования и язык Pascal нового поколения для платформы Microsoft .NET. Язык PascalABC.NET содержит все основные элементы современных языков программирования: модули, классы, перегрузку операций, интерфейсы, исключения,
Общие сведения
Общие сведения Электронная почта (E-mail) – один из первых сервисов Интернета, который до сих пор является самым популярным.Пользователи электронной почты могут обмениваться между собой письмами. Каждое письмо пользователь создает на своем компьютере, после чего
Общие сведения
Общие сведения Макрос – это программа, написанная на некотором языке, которая используется обычно для автоматизации определенных процессов внутри приложений. В данном случае разговор пойдет о языках Visual Basic for Applications (VBA) и WordBasic (WB), которые Microsoft использует в своих