Глава 4 Семантические и визуальные интернет-поисковики

Глава 4

Семантические и визуальные интернет-поисковики

Фрэнсис. Бэкон в свое время заметил, что правильная постановка вопроса свидетельствует о некотором знакомстве с делом. Этот афоризм четырехвековой давности можно применить и к процессу составления поисковых запросов. Для перевода сложного, комплексного вопроса в подходящий набор ключевых слов иногда приходится здорово поломать голову. Вот если бы поисковик мог прямо отвечать на задаваемые вопросы!. Хорошая новость: такие поисковые машины уже существуют и называются «семантическими», или же «поисковиками с обработкой запросов на естественном языке». В этой главе мы познакомимся с лучшими представителями этого класса интернет-поисковиков, реализующими семантические технологии разбора запросов на русском языке.

Прежде чем начинать рассказ о конкретных машинах, разберемся в некоторых характеристиках, отличающих семантические поисковики, и самых общих принципах их работы с точки зрения пользователя. Это позволит в дальнейшем избежать ненужных повторов.

Техническая реализация поиска по прямым вопросам с последующей выдачей на них осмысленных ответов в общем случае такова: поисковая машина принимает заданную пользователем поисковую фразу, после чего пытается автоматически выделить в ее составе ключевые слова и определить их взаимоотношения. Одновременно отбрасывается информационный шум, то есть слова, не несущие смысловой нагрузки. Другими словами, на данном этапе происходит автоматическая формализация поискового запроса и генерирование на его основе четкого поискового образа. Затем он передается более или менее стандартному алгоритму поиска в базе проиндексированных документов.

Следующая важная особенность семантических поисковиков – результаты поиска. Если обычные поисковики в основном предоставляют пользователю ссылки на веб-сайты, где предположительно находится необходимая информация, то семантические поисковики пытаются давать прямые ответы, самостоятельно выделяя в проиндексированных документах нужные фрагменты. В результате страница выдачи подобного поисковика выглядит несколько необычно. Вместо списка релевантных запросу ссылок пользователю предлагается список прямых ответов на заданный пользователем вопрос. Другими словами, главным режимом работы семантического поисковика является режим фактографического поиска.

Практически все современные семантические поисковики в настоящее время находятся в стадии бета-тестирования. В их работе еще встречается немало ограничений. Для эффективного использования таких машин в повседневной работе необходимо не только обладать сведениями об их возможностях, но и представлять себе сферу их применения, то есть ту область, в которой они обладают преимуществами по сравнению с обычными поисковиками.

Данный текст является ознакомительным фрагментом.