Exalead

Exalead

Одной из особенностей Европы, в том числе и в сфере интернет-поиска, является большое количество национальных языков. Поисковик, претендующий на место ведущего в Европе, просто обязан хорошо индексировать национальные сегменты интернета и качественно обрабатывать запросы на многочисленных европейских языках – как крупнейших, так и менее распространенных. Именно в данной области европейская разработка может получить серьезное конкурентное преимущество по сравнению с мощными заокеанскими конкурентами. На роль такого европейского поисковика в настоящее время всерьез претендует система Exalead. Данный проект был разработан в рамках исследовательской программы Quaere, финансируемой Евросоюзом.

Exalead располагает собственными индексными базами. Основные поисковые ресурсы системы – это базы веб-документов, изображений, видео и новостей. Стартовая страница Exalead предлагает возможность персональной настройки. На этой странице можно разместить ссылки на свои любимые сайты – они будут отображаться в виде графических миниатюр-скриншотов. Правда, для этого придется бесплатно зарегистрировать аккаунт, а также разрешить браузеру хранить куки-файлы Exalead.

Веб-поиск Exalead предлагает режимы простого и расширенного поиска. Форма расширенного поиска, как и в Bing, открывается прямо на странице выдачи Отметим, что Exalead предлагает не просто привычную форму с набором дополнительных полей, а сложное выпадающее меню, которое играет роль мастера по уточнению запроса (рис. 1.7). При выборе того или иного пункта в меню мастера в строку запроса добавляются новые элементы, а при необходимости операторы и спецсимволы.

Рис. 1.7. Мастер расширенного поиска Exalead

В меню мастера выделено три тематических блока. Первый блок дает возможность определиться с вариантами уточнения запроса. Предлагаются поиск по фразе, обязательное включение и исключение заданных пользователем слов, а также поиск с помощью масок. Поддерживается использование в запросе стандартных логических операторов. Кроме этих базовых опций, предлагаются и более интересные варианты. В режиме Approximate Spelling Search ищутся слова, подобные по написанию заданным. Режим Phonetic Search позволяет найти слова, похожие по своему звучанию на указанные пользователем. Если предложения по исправлению опечаток уже давно можно найти на других поисковиках, то поиск по звуковой транскрипции слова можно назвать новинкой.

Оставшиеся два блока расширенного поиска предлагают отфильтровать результаты по дате их появления в индексе поисковика, а также ограничить поиск определенным сайтом, заголовком страницы или другим формальным признаком.

Каждую позицию в перечне найденных ссылок на странице выдачи сопровождают миниатюры-скриншоты страниц и краткая текстовая аннотация (рис. 1.8). Страница выдачи Exalead также отличается широким выбором вспомогательных инструментов, собранных на боковой панели. Первый блок фильтров позволяет ограничить выдачу результатами, найденными на сайтах и в блогах. Следующие два блока позволяют отобрать контент определенного формата. Распознается большое количество «офисных» форматов файлов, а также видео– и аудиофайлы. Фильтр даты публикации позволяет быстро просмотреть результаты, проиндексированные в определенный промежуток времени. По умолчанию шаг такого фильтра – один год. Фильтр Related Terms предлагает ознакомиться с автоматически подобранными дополнительными ключевыми словами, которые способны помочь в уточнении запроса.

Рис. 1.8. Страница результатов поиска системы Exalead

Два последних блока фильтров выполнены в виде интерактивных круговых диаграмм. Они демонстрируют процентное распределение результатов поиска по языковому признаку и по принадлежности к национальным сегментам интернета. Щелкая на секторах диаграмм или же на соответствующих позициях сопровождающих списков, можно быстро отфильтровать результаты поиска по выбранному критерию. Любой найденный сайт можно добавить в свою персональную базу закладок.

Отдельным видом поиска в Exalead является поиск в Википедии. В этом режиме на странице выдачи все найденные ссылки сопровождаются не только стандартным скриншотом и текстовой выдержкой, но и перечнем тематических категорий, персон, организаций и местоположений, упомянутых в найденной статье энциклопедии. Страница выдачи содержит боковую панель с облаком тегов, в котором также выделены названные перечни дополнительных признаков. Кроме того, поддерживается быстрая сортировка результатов по языку с помощью выпадающего меню.

Exalead предлагает хорошие возможности для поиска мультимедиаконтента – изображений и видео. Инструменты расширенного поиска изображений вынесены на специальную панель фильтров, которая располагается над списком выдачи Кроме стандартных фильтров по размеру картинки и типу файла, предлагаются возможности отбора изображений по ориентации снимка (книжная или альбомная). Есть у Exalead и визуальные фильтры. С их помощью можно отбирать картинки по цветовой гамме – соответствующая палитра доступна на панели фильтров, а также разделить фотоснимки и рисованную графику, правда, эта опция не всегда работает уверенно.

При просмотре результатов поиска изображений доступен режим вывода найденных картинок в виде бесконечной ленты. Это значит, что результаты поиска не разбиваются на отдельные страницы, а новые миниатюры просто автоматически подгружаются по мере прокрутки страницы результатов. Включить эту возможность можно при настройке поисковика, установив флажок Allow infinite scroll in image search.

Видеопоиск Exalead работает в базах крупных видеохостингов. Полного списка поддерживаемых ресурсов разработчики не сообщают, однако в результатах тестовых запросов удалось отследить примерно два десятка ресурсов. Среди них – YouTube, Metacafe, Dailymotion, Reuters, Comedy Central и ряд других. Отметим, что в результатах попадались и ролики Rutube. На боковой панели страницы выдачи предлагаются опции для отбора результатов поиска по продолжительности ролика, источнику, а также тематической категории. В последнем случае используются теги, которыми ролики помечены на хостинге-источнике. Результаты можно отсортировать не только по релевантности, но и по дате добавления, а также рейтингам роликов на видеохостингах.

Для поиска новостных сюжетов можно воспользоваться вертикальным сервисом Voxalead News. Источниками роликов служат базы трех десятков телеканалов. Представлены проекты на английском, французском, китайском и арабском языках. Диапазон достаточно широк: от CNN до Al Jazeera, есть в списке и Russia Today. Результаты можно ограничить только выбранными пользователем каналами. Такая настройка доступна в меню Select Sources. Любопытно, что кроме поиска новостного видео Exalead предлагает поиск записей новостей десятка радиостанций. Щелчок на любой позиции в списке результатов, будь то видео или аудио, открывает страницу со встроенным плеером, а также полным текстом новости. Для каждого ролика предлагается панель тегов, состоящая из трех вкладок: People, Organization и Location. На них группируются автоматически выделенные из текста новости ключевые слова, относящиеся к персонам, организациям или географическим пунктам. Щелчки на них подсвечивают соответствующие фрагменты в тексте новости, а также включают переход в ролике к данному фрагменту.

Как и положено серьезным проектам интернет-поиска, Exalead обзавелся собственной «лабораторией», в которой представлен ряд экспериментальных разработок, пока не внедренных в основной поиск.

Экспериментальный интерфейс Exalead Constellations предназначен для визуализации результатов поиска. Найденные по запросу ссылки демонстрируются в виде своеобразной «звездной карты». При ее построении учитывается количество ссылок на тот или иной сайт – они демонстрируются в виде цветных лучей. Чем их больше, тем ближе к центру «галактики» будет расположена «звезда» сайта. Над полем поиска выводятся уточнения, с помощью которых можно быстро отсортировать ресурсы, посвященные персоналиям. Кроме того, в Constellations доступны практически все инструменты фильтрации стандартного варианта Exalead. Вызвать соответствующую панель фильтров можно с помощью ссылки Refines.

Любопытен экспериментальный сервис Exalead Wikifier. С его помощью можно «викифицировать» любую веб-страницу в ходе серфинга. Смысл этой операции заключается в том, что сервис ищет на открытой веб-странице ключевые слова, значения которых есть в Википедии, после чего подсвечивает их цветным выделением. Наведя на него указатель мыши, пользователь получает всплывающее окошко с информацией из сетевой энциклопедии, а также ссылки на страницу. Википедии и результаты поиска Exalead выделенного слова. Викифицировать можно не только указанную веб-страницу, но и текст, введенный в поле на стартовой странице Wikifier. В результате получается своеобразный встроенный справочник, прозрачно работающий во время серфинга.

Проект Chromatik Search предлагает поиск изображений по визуальным признакам. Поиск можно начинать с ключевого слова, а можно сразу же воспользоваться панелью визуальных инструментов. С помощью палитры выбираются цвета, которые должны присутствовать в нужном вам изображении. Их процентное соотношение устанавливается простым перетаскиванием ползунка Adjust Proportions. В результате можно достаточно точно описать характеристики искомой картинки. Благодаря этому простому в работе средству разработчикам Chromatik удалось, с одной стороны, добиться высокой точности запроса, а с другой стороны, сделать этот процесс максимально простым для пользователя. Во всяком случае, решающий аналогичные задачи алгоритм IBM QBIC заметно сложнее в освоении. Дополнительная настройка запроса позволяет управлять цветностью искомой картинки, а также искать более светлые или более темные изображения. Интересно, что характеристики запроса, составленные с помощью графических инструментов, дублируются текстом, который выводится над областью выдачи результатов. В результате Exalead предлагает один из наиболее удобных на сегодняшний день интерфейсов для визуального поиска изображений (рис. 1.9).

Рис. 1.9. Экспериментальный проект Exalead Chromatic Search

Есть у Exalead и своя экспериментальная поисковая машина для Twitter, которая называется Tweepz. В настоящее время она индексирует более пятнадцати миллионов аккаунтов. Интересно выполнена заявка на включение в индекс. Если пользователь желает, чтобы его сообщения попадали в базу Tweepz, достаточно зафолловить канал @tweepz. Система поддерживает собственный язык запросов. Он позволяет работать с масками, вести поиск по именам и географическому местоположению пользователей. Страница результатов поиска содержит боковую панель с хорошим выбором фильтров. Результаты можно сортировать по релевантности, количеству фолловеров и языкам. Кроме того, в Tweepz работает система автоматического поиска дополнительных ключевых слов, с помощью которых можно уточнить запрос.

Если рассмотренные нами ранее проекты отличаются своей технической сложностью, то Exalead Light демонстрирует прямо противоположный подход к поиску. Это «легкая», максимально упрощенная версия поиска Exalead, предлагающая только текстовые инструменты уточнения запросов Exalead Light отличается также более высокой скоростью работы. В то же время здесь не поступились качеством поиска – доступны все вертикальные базы проекта.

Exalead обладает хорошей подборкой дополнительных программ. Букмарклет Exalead позволяет создавать закладки на веб-страницы в ходе серфинга и сохранять их в своем онлайновом профиле. Поисковый плагин Exalead предлагает стандартные опции и работает в браузерах Internet Explorer и Firefox. Для веб-мастеров предлагается поиск по сайту на основе технологии Exalead. Впечатление от него двоякое. С одной стороны, там работают многие фирменные «фишки» Exalead, например визуальные фильтры-диаграммы. С другой стороны, глубина индексирования сайтов сильно зависит от страны их происхождения. Для русскоязычных сайтов такой поиск пока практически бесполезен.

Данный текст является ознакомительным фрагментом.