Использование языка запросов поисковых машин
Использование языка запросов поисковых машин
В строку запроса поисковой машины, помимо ключевых слов, можно вводить так называемые операторы – специальные служебные слова или символы, которые сообщают поисковой системе, каким образом нужно обращаться с теми или иными ключевыми словами. Поиск операторов в документе не производится.
У каждой поисковой машины свой синтаксис языка запросов. В одних случаях он реализован лучше, в других – хуже.
Не будем рассматривать синтаксис отдельно взятой поисковой системы (детальное описание языка запросов любой системы можно без труда найти на ее сайте), а поговорим об основных операторах и правилах, работающих одинаково в большинстве поисковых машин. Их, как правило, бывает вполне достаточно.
– Операторы. Запрос, состоящий из нескольких слов, может содержать операторы. Каждый оператор имеет левую и правую части (то есть, соответственно, то, что стоит перед оператором и после него).
• AND (логическое И) – и левая, и правая части этого оператора должны присутствовать в тексте одновременно. Иными словами, при запросе «самолет AND вертолет» результатом поиска будут документы, которые содержат одновременно и слово «самолет», и слово «вертолет». Как правило, если оператор явно не указан и слова разделены пробелом, то по умолчанию используется оператор AND. Таким образом, запрос «дешевый фотоаппарат» будет истолкован поисковой машиной как «дешевый AND фотоаппарат».
• OR (логическое ИЛИ) – при использовании этого оператора в найденном тексте должна присутствовать или его левая, или правая часть. Этот оператор очень удобен при поиске синонимов. Например, в результате запроса «учеба OR занятие OR обучение» будут найдены документы, содержащие хотя бы одно из перечисленных слов.
• NOT (логическое НЕ) – отсекает документы, находящиеся в его правой части. Так, по запросу «игры NOTкомпьютерные» будут найдены веб-страницы, в которых есть слово «игры», но нет слова «компьютерные».
Если в запросе присутствует несколько операторов, то поисковая машина будет работать с ними в соответствии с их приоритетом. Обычно операторы AND и NOT имеют более высокий приоритет, нежели OR. Другими словами, при обработке таких запросов поисковая машина будет сначала группировать ключевые слова по операторам AND и NOT, а только потом по операторам OR. Однако порядок группировки можно изменять. Для этого предусмотрены скобки.
– Скобки. Скобки задают порядок действия логических операторов. Они представляют собой превосходный инструмент, позволяющий строить очень гибкие и эффективные запросы.
Ключевые слова, заключенные в скобки, трактуются операторами, как одно целое. Таким образом, появляется возможность изменять приоритеты операторов и строить сложные вложенные запросы. Например, по запросу «мобильный OR сотовый AND телефон» в соответствии с приоритетами будут выданы документы, содержащие либо слово «мобильный», либо одновременно слова «сотовый» и «телефон». При использовании скобок запрос вида «(мобильный OR сотовый) AND телефон» задает поиск документов, где встречается слово «телефон», а также слово «мобильный» или «сотовый».
Можно строить самые разные конструкции. К примеру, вы хорошо владеете китайским языком и хотите найти себе удаленную работу. Тогда формируем запрос «переводчик AND китайский». Дальше логично написать что-то вроде «требуется» или «работа». Однако чтобы поиск был более эффективным, лучше предусмотреть как можно больше вариантов. Поэтому добавляем к запросу «(работа OR требуется OR вакансия)». Далее следует показать машине, что вы хотите работать удаленно, поэтому добавляем «(удаленная OR дистанционная OR внештатная)». Ну а чтобы исключить из списка найденных документов всевозможные резюме таких же, как вы, соискателей, в конце можно дописать «NOT (резюме OR ищу OR предлагаю)». В конечном итоге получим следующий текст запроса:
(переводчик AND китайский AND (работа OR требуется OR вакансия) AND (удаленная OR дистанционная OR внештатная)) NOT (резюме OR ищу OR предлагаю)
Возможно, это выглядит слегка устрашающе, зато работает довольно эффективно.
– Кавычки. В большинстве поисковых систем по умолчанию поиск учитывает все формы заданного ключевого слова. Чтобы искать точные словоформы, предусмотрены кавычки. Ключевые слова, заключенные в кавычки, ищутся именно в той форме и последовательности, в которой использовались в запросе. Таким образом очень удобно искать, к примеру, цитаты.
– Поиск с расстоянием. Допустим, вы хотите собственными руками собрать радиоприемник и сформировали запрос «схема радиоприемник». Поисковая машина, согласно алгоритму, начнет поиск документов, содержащих оба ключевых слова. В итоге в списке найденных веб-страниц будет огромное количество документов, в которых эти слова совершенно не связаны между собой и находятся в разных частях текста. Чтобы этого не допустить и не получить ссылки на документы, в которых «радиоприемник работал так громко, что мешал изучать схему подземных сооружений», предусмотрен поиск с расстоянием.
В языках запросов различных поисковых машин расстояние ограничивается по-разному. Например, в Яндексе это осуществляется следующим образом. Если все слова в тексте пронумеровать по порядку их следования, то расстояние между какими-либо двумя словами будет равно разнице между номерами этих слов. Таким образом, расстояние между соседними словами равно 1, а между словами, стоящими наоборот, – -1. Для определения расстояния в Яндексе применяется символ «/». Так, на запрос «схема /2 радиоприемник» будут найдены документы, в которых присутствуют слова «схема» и «радиоприемник», причем расстояние между ними составляет не более двух слов и они находятся в одном предложении. В других поисковых системах синтаксис может быть другим, но суть примерно та же.
Кроме того, некоторые поисковые системы позволяют искать по адресам сайтов, ключевым словам, аннотациям, подрисуночным подписям и т. д.
В табл. 4.1 приведены основные правила языков запроса самых популярных отечественных поисковых систем.
Таблица 4.1. Основные правила языков запроса поисковых систем
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКДанный текст является ознакомительным фрагментом.
Читайте также
Поиск по трекерам средствами поисковых машин
Поиск по трекерам средствами поисковых машин Если вы пользуетесь услугами пиринговой сети не часто, а от случая к случаю, то можете искать ссылки или так называемые торренты с помощью поисковой машины Google. Для этого достаточно ввести в поле ввода ключевых слов для поиска
Описание языков запросов различных поисковых машин
Описание языков запросов различных поисковых машин Умение искать информацию с помощью поисковых машин очень важно для создания и последующей раскрутки блога.Благодаря поисковым машинам можно своевременно собирать информацию, появляющуюся в Интернете по теме, которой
Поиск с помощью языка операторов запросов поисковых систем как инструмент раскрутки блога
Поиск с помощью языка операторов запросов поисковых систем как инструмент раскрутки блога Чтобы блог пользовался успехом у читателей, он должен содержать полезные для них материалы – об этом мы уже говорили. Если вы выбрали в качестве контента не художественные
История развития поисковых машин
История развития поисковых машин История эволюции поисковых машин наиболее полно, на наш взгляд, представлена в книге признанных экспертов в области невидимого интернета Криса Шермана и Гарри Прайса «Невидимый Интернет».[2]До середины 1960-х годов компьютеров было
Ограничения возможностей поисковых машин
Ограничения возможностей поисковых машин 1. Физические ограничения скорости. Информационные системы имеют физические ограничения по скорости поиска новых страниц. Скажем так, скорость, с которой сегодня паук пытается найти новые страницы, оказывается ниже, чем
1.1.1. Компоненты поисковых машин
1.1.1. Компоненты поисковых машин Информация в Сети не только пополняется, но и постоянно изменяется, но об этих изменениях никто никому не сообщает. Отсутствует единая система занесения информации, одновременно доступная для всех пользователей Интернета. Поэтому с целью
1.1.2. Характеристики поисковых машин
1.1.2. Характеристики поисковых машин В статье, посвященной поисковой машине Rambler (http://www.rambler.ru/ doc/architecture.shtml), называются основные характеристики, которые могут быть применены к любым поисковикам:? полнота;? точность;? актуальность;? скорость;? наглядность.Полнота поиска
5.4. Оптимизация сайта для поисковых машин
5.4. Оптимизация сайта для поисковых машин Какие задачи решает оптимизация для поисковых машин Поисковые машины сегодня являются важнейшим инструментом навигации в Интернете. С их помощью в Сети ищут информацию, сравнивают, анализируют, спрашивают совета, ищут
Какие задачи решает оптимизация для поисковых машин
Какие задачи решает оптимизация для поисковых машин Поисковые машины сегодня являются важнейшим инструментом навигации в Интернете. С их помощью в Сети ищут информацию, сравнивают, анализируют, спрашивают совета, ищут единомышленников, знакомых и даже смысл жизни. Если
Правила построения поисковых запросов
Правила построения поисковых запросов Как уже отмечалось, в Интернете существует множество поисковых серверов, отечественных и зарубежных.Российские поисковые серверы:• «Яндекс» – www.yandex.ru;• «Рамблер» – www.rambler.ru;• «Апорт» – www.aport.ru;• Gogo – www.gogo.ru.Зарубежные поисковые
ИСПОЛЬЗОВАНИЕ ЯЗЫКА СИ
ИСПОЛЬЗОВАНИЕ ЯЗЫКА СИ Си — язык "компилируемого" типа. Не огорчайтесь, если это звучит для вас пока как непонятный набор слов; вы поймете, что это значит, когда мы опишем этапы процесса создания работающей Си-программы.Если вы привыкли использовать какой-нибудь язык
1. Оператор Select – базовый оператор языка структурированных запросов
1. Оператор Select – базовый оператор языка структурированных запросов Центральное место в языке структурированных запросов SQL занимает оператор Select, с помощью которого реализуется самая востребованная операция при работе с базами данных – запросы.Оператор Select
Использование планов запросов для просмотров
Использование планов запросов для просмотров Просмотры могут представлять для пользователей некоторые сложности относительно возможности PLAN. В основном пользователи могут трактовать просмотры как обычные таблицы. Однако, если вы захотите определить пользовательский