Использование языка запросов поисковых машин

We use cookies. Read the Privacy and Cookie Policy

Использование языка запросов поисковых машин

В строку запроса поисковой машины, помимо ключевых слов, можно вводить так называемые операторы – специальные служебные слова или символы, которые сообщают поисковой системе, каким образом нужно обращаться с теми или иными ключевыми словами. Поиск операторов в документе не производится.

У каждой поисковой машины свой синтаксис языка запросов. В одних случаях он реализован лучше, в других – хуже.

Не будем рассматривать синтаксис отдельно взятой поисковой системы (детальное описание языка запросов любой системы можно без труда найти на ее сайте), а поговорим об основных операторах и правилах, работающих одинаково в большинстве поисковых машин. Их, как правило, бывает вполне достаточно.

– Операторы. Запрос, состоящий из нескольких слов, может содержать операторы. Каждый оператор имеет левую и правую части (то есть, соответственно, то, что стоит перед оператором и после него).

• AND (логическое И) – и левая, и правая части этого оператора должны присутствовать в тексте одновременно. Иными словами, при запросе «самолет AND вертолет» результатом поиска будут документы, которые содержат одновременно и слово «самолет», и слово «вертолет». Как правило, если оператор явно не указан и слова разделены пробелом, то по умолчанию используется оператор AND. Таким образом, запрос «дешевый фотоаппарат» будет истолкован поисковой машиной как «дешевый AND фотоаппарат».

• OR (логическое ИЛИ) – при использовании этого оператора в найденном тексте должна присутствовать или его левая, или правая часть. Этот оператор очень удобен при поиске синонимов. Например, в результате запроса «учеба OR занятие OR обучение» будут найдены документы, содержащие хотя бы одно из перечисленных слов.

• NOT (логическое НЕ) – отсекает документы, находящиеся в его правой части. Так, по запросу «игры NOTкомпьютерные» будут найдены веб-страницы, в которых есть слово «игры», но нет слова «компьютерные».

Если в запросе присутствует несколько операторов, то поисковая машина будет работать с ними в соответствии с их приоритетом. Обычно операторы AND и NOT имеют более высокий приоритет, нежели OR. Другими словами, при обработке таких запросов поисковая машина будет сначала группировать ключевые слова по операторам AND и NOT, а только потом по операторам OR. Однако порядок группировки можно изменять. Для этого предусмотрены скобки.

– Скобки. Скобки задают порядок действия логических операторов. Они представляют собой превосходный инструмент, позволяющий строить очень гибкие и эффективные запросы.

Ключевые слова, заключенные в скобки, трактуются операторами, как одно целое. Таким образом, появляется возможность изменять приоритеты операторов и строить сложные вложенные запросы. Например, по запросу «мобильный OR сотовый AND телефон» в соответствии с приоритетами будут выданы документы, содержащие либо слово «мобильный», либо одновременно слова «сотовый» и «телефон». При использовании скобок запрос вида «(мобильный OR сотовый) AND телефон» задает поиск документов, где встречается слово «телефон», а также слово «мобильный» или «сотовый».

Можно строить самые разные конструкции. К примеру, вы хорошо владеете китайским языком и хотите найти себе удаленную работу. Тогда формируем запрос «переводчик AND китайский». Дальше логично написать что-то вроде «требуется» или «работа». Однако чтобы поиск был более эффективным, лучше предусмотреть как можно больше вариантов. Поэтому добавляем к запросу «(работа OR требуется OR вакансия)». Далее следует показать машине, что вы хотите работать удаленно, поэтому добавляем «(удаленная OR дистанционная OR внештатная)». Ну а чтобы исключить из списка найденных документов всевозможные резюме таких же, как вы, соискателей, в конце можно дописать «NOT (резюме OR ищу OR предлагаю)». В конечном итоге получим следующий текст запроса:

(переводчик AND китайский AND (работа OR требуется OR вакансия) AND (удаленная OR дистанционная OR внештатная)) NOT (резюме OR ищу OR предлагаю)

Возможно, это выглядит слегка устрашающе, зато работает довольно эффективно.

– Кавычки. В большинстве поисковых систем по умолчанию поиск учитывает все формы заданного ключевого слова. Чтобы искать точные словоформы, предусмотрены кавычки. Ключевые слова, заключенные в кавычки, ищутся именно в той форме и последовательности, в которой использовались в запросе. Таким образом очень удобно искать, к примеру, цитаты.

– Поиск с расстоянием. Допустим, вы хотите собственными руками собрать радиоприемник и сформировали запрос «схема радиоприемник». Поисковая машина, согласно алгоритму, начнет поиск документов, содержащих оба ключевых слова. В итоге в списке найденных веб-страниц будет огромное количество документов, в которых эти слова совершенно не связаны между собой и находятся в разных частях текста. Чтобы этого не допустить и не получить ссылки на документы, в которых «радиоприемник работал так громко, что мешал изучать схему подземных сооружений», предусмотрен поиск с расстоянием.

В языках запросов различных поисковых машин расстояние ограничивается по-разному. Например, в Яндексе это осуществляется следующим образом. Если все слова в тексте пронумеровать по порядку их следования, то расстояние между какими-либо двумя словами будет равно разнице между номерами этих слов. Таким образом, расстояние между соседними словами равно 1, а между словами, стоящими наоборот, – -1. Для определения расстояния в Яндексе применяется символ «/». Так, на запрос «схема /2 радиоприемник» будут найдены документы, в которых присутствуют слова «схема» и «радиоприемник», причем расстояние между ними составляет не более двух слов и они находятся в одном предложении. В других поисковых системах синтаксис может быть другим, но суть примерно та же.

Кроме того, некоторые поисковые системы позволяют искать по адресам сайтов, ключевым словам, аннотациям, подрисуночным подписям и т. д.

В табл. 4.1 приведены основные правила языков запроса самых популярных отечественных поисковых систем.

Таблица 4.1. Основные правила языков запроса поисковых систем

Данный текст является ознакомительным фрагментом.