4. Информационно-поисковые системы
4. Информационно-поисковые системы
Поиск информации является одной из основных составляющих человеческой деятельности, с ним мы сталкиваемся ежедневно: изучая театральную афишу, чтобы выбрать интересный спектакль, подбирая в расписании поездов удобную электричку, листая телефонную книгу. Человеку, в силу своей профессии или увлечений часто сталкивающемуся с подбором и поиском какой-либо тематической информации, рано или поздно (с возрастанием ее объема) приходится применять некоторые принципы систематизации и классификации имеющихся данных, обеспечивающие более удобный и эффективный поиск. Так, в библиотеках составляют картотеку: сведения о книге по определенной схеме записываются на карточку, туда же помещается шифр - несколько букв и цифр, по которым можно определить местоположение книги (хранилище, стеллаж, полку); карточки расставляются в алфавитном или тематическом порядке. Применение ЭВМ дает более широкие возможности для работы с большими массивами информации.
4.1. Основные определения
Информационно-поисковая система (ИПС) - программная система для хранения, поиска и выдачи интересующей пользователя (абонента) информации. Абонент обращается к ИПС с информационным запросом - текстом, отражающим информационную потребность данного абонента, например, его желание найти список книг по теории информационного поиска или список аптек, в которых можно купить нужное лекарство. Поиск информации ведется в поисковом массиве, который формируется (и по мере необходимости обновляется) разработчиками или администраторами системы. Элементы поискового массива вводятся в информационно-поисковую систему на естественном (или близком к нему) языке, а затем обычно подвергаются индексированию, т.е. переводу на формальный информационно-поисковый язык.
Индексирование - выражение центральной темы или предмета какого-либо текста или описание какого-либо объекта на информационно-поисковом языке[1].
Предмет - объект (материальная вещь, понятие, свойство или отношение), который рассматривается или упоминается в документе/информационном запросе.
Тема документа/информационного запроса - раздел науки или техники, область практической деятельности или проблема, которой посвящен документ/ информационный запрос.
По характеру поискового массива и выдаваемой информации ИПС подразделяют на документальные и фактографические.
Документальная ИПС предназначена для отыскания документов (статей, книг, отчетов, описаний к авторским свидетельствам и патентам), содержащих необходимую информацию. Поисковый массив такой ИПС состоит из поисковых образов документов (т.е. элементов, каждый из которых передает основное содержание документа) или из самих документов. В ответ на предъявляемый информационный запрос ИПС выдает некоторое множество документов (или адреса их хранения), содержащих искомую информацию. Документом называют любой осмысленный текст, который обладает определенной логической завершенностью и содержит сведения о его источнике и/или создателе.
Фактографическая ИПС обеспечивает выдачу непосредственно фактических сведений, затребованных потребителем в информационном запросе. Поисковый массив состоит из фактографических записей, т.е. из описаний фактов, извлеченных из документов и представленных на некотором формальном языке.
Например, если бы Служба знакомств решила создать документальную ИПС, поисковый массив состоял бы непосредственно из писем ее клиентов типа: "Меня зовут Илья Муромец. Просидел я сиднем на печи 33 года, а теперь у царя в охранниках...". Для создания фактографической ИПС по письмам клиентов заполнялись бы таблицы вида: "Фамилия - Муромец. Имя - Илья. Возраст - 33. Должность - секьюрити". Соответственно и запросом в первом случае будет служить часть письма клиента с пожеланиями относительно его партнера: "Невесту хочу моложе меня, но премудрую и чтоб хозяйством домашним интересовалась", а во втором - составленная по ней таблица: "Возраст ‹33, интеллект - высокий, интересы - домашнее хозяйство".
В настоящее время фактографические ИПС (как специальный класс поисковых систем) практически не разрабатываются, выполняемые ими действия реализуются с помощью штатных СУБД. Далее, говоря ИПС, будем иметь в виду документальную информационно-поисковую систему.
Одним из популярных способов перевода документа на внутренний язык системы является координатное индексирование - присвоение документу набора ключевых слов или кодов, определяющих его содержание. Возможны два способа индексирования: свободное, когда непосредственно из текста документа извлекаются ключевые слова без учета всех видоизменений их форм и отношений между ними; и контролируемое, когда в поисковый образ документа включаются только те слова, которые зафиксированы в информационно-поисковом тезаурусе, где указаны их синонимические, морфологические и ассоциативные отношения.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКЧитайте также
Поисковые системы
Поисковые системы Чтобы поиск в Интернете был удобным, быстрым и эффективным, созданы специальные поисковые системы. Убежден, что практически каждый сеанс вашей работы в Интернете не обойдется без того, чтобы вы не воспользовались любимой поисковой системой. Поэтому
Поисковые системы
Поисковые системы Регистрация в поисковых системах – это важнейший шаг при раскрутке своего сайта, так как подавляющее большинство пользователей Интернета ищут инфор —мацию именно с помощью поисковых сайтов. Однако бездумная регистрация не сильно повысит
Поисковые программы
Поисковые программы В последнее время наряду с онлайновыми поисковыми машинами появляются и другие инструменты, предназначенные для поиска в Интернете. Одним из таких инструментов являются поисковые программы. Особенностью их работы является возможность искать сразу
Информационно-аналитическая система «Семантический архив»
Информационно-аналитическая система «Семантический архив» Информационно-аналитическая система «Семантический архив» разработана компанией «Аналитические бизнес решения».Она предназначена для автоматизации деятельности соответствующих служб коммерческих
Информационно-мониторинговая система «Web-Observer»
Информационно-мониторинговая система «Web-Observer» Информационно-мониторинговая система предназначена для автоматического сбора, структурирования и первичной обработки информационных сообщений, публикуемых в интернет-источниках и приходящих на электронные адреса в
Информационно-программный комплекс «Тренд»
Информационно-программный комплекс «Тренд» ИПК «Тренд» позволяет:– производить исследования интересующих объектов и процессов;– прогнозировать изменения в их состоянии на период до двух месяцев с вероятностью более 63 % на основе сравнения информационных образов
Как работают поисковые системы?
Как работают поисковые системы? Раньше я была уверена в том, что при моем запросе, скажем, новости грузоперевозок, поисковые системы, те же Яндекс и Google со скоростью света начинают прочесывать все существующие в мире сайты, все их странички, в надежде отыскать что-то
Поисковые системы
Поисковые системы Поисковые системы (англ. search engine) представляют собой инструменты для поиска информации в Сети. Они индексируют сайты с помощью специальных программ (поисковых роботов). Когда посетители поисковой системы задают тот или иной вопрос, она ранжирует
Оптимизация под поисковые системы
Оптимизация под поисковые системы Как мы уже говорили, большинство пользователей ищут информацию с помощью поисковых систем. Оттуда на интернет-сайты приходит множество целевых посетителей. В зависимости от того, на каком месте по наиболее важным запросам находится
Восемь действенных способов ускорить попадание ваших материалов в поисковые системы
Восемь действенных способов ускорить попадание ваших материалов в поисковые системы На просторах Интернета существует множество привлекательных сайтов, которые совсем не посещают пользователи.Причина проста – никто не знает об их существовании. Сайты находятся в
Поисковые системы
Поисковые системы Пользователи, работающие в Сети, довольно часто применяют поисковые системы. Конечно, часть информации изначально ищется на тематических ресурсам, однако наиболее популярные поисковые системы также активно используются. Начал появляться класс
10.2.1. Поисковые машины
10.2.1. Поисковые машины Интернет содержит огромное количество информации. Ведь в Интернете создать сайт может любой желающий, поэтому количество новых сайтов растет с каждым днем. Для поиска в Интернете используются поисковые машины.Поисковая машина — это специальный
Поисковые системы
Поисковые системы Это адреса, которые вы должны запомнить прежде всего и крепко-накрепко. С помощью поисковых систем можно отыскать любой другой сайт в
8.2. Поисковые системы
8.2. Поисковые системы Для быстрого и удобного поиска информации во Всемирной паутине существуют специальные сайты — поисковые системы. В разд. 6.2 я уже упоминал об одной такой системе — Яндексе (http://www.yandex.ru). Кроме Яндекса существует еще несколько популярных поисковых