Глава 7 Поиск изображений
Глава 7
Поиск изображений
Интернет-поиск уже давно не ограничивается только текстовыми документами. Пожалуй, следующий по популярности тип контента – изображения. Сейчас можно насчитать три основных направления в развитии технологий интернет-поиска изображений – это индексация по косвенным признакам, построение разнообразных каталогов и контентный поиск изображений.
Индексация по косвенным признакам остается наиболее популярным способом поиска изображений. Этот способ широко представлен в вертикальных базах изображений универсальных интернет-поисковиков, благо практически все крупные машины предлагают такие возможности поиска. В данном варианте интернет-поиск изображений концептуально не отличается от поиска веб-страниц и других текстовых документов. Поисковик при индексации работает не с самим изображением, а с его косвенными признаками: именами графических файлов и тегами, присвоенными в HTML-разметке. Кроме того, анализируются подписи и текст, расположенный рядом с изображением на веб-странице, изучается текст гиперссылок, ведущих к той или иной картинке. Именно такие косвенные признаки изображения и заносятся в индексную базу, по которой затем ведется поиск при поступлении запросов от пользователей.
Подобные поисковики принимают запрос от пользователя в виде привычной текстовой строки, содержащей ключевые слова. Как правило, к характеристикам собственно изображений относятся только поля расширенного поиска, определяющие формат файла, размер изображения и другие подобные признаки.
Преимущества такого подхода понятны: его относительно проще реализовать. Кроме того, задействуются огромные индексные базы, что обеспечивает хороший охват поиска. Недостатки также очевидны: поскольку поиск идет по косвенным признакам, причем исключительно в автоматическом режиме, неизбежны информационный шум и ошибки.
Избавиться от неточностей и шума, свойственных автоматическому индексированию по косвенным признакам, можно несколькими способами. Один из них – включить в работу системы человека. Подробное описание картинок по заданной заранее схеме обычно имеет место в тематических галереях изображений. Перед включением изображения в базу данных на него заполняется своеобразная анкета, в которой содержится заранее отобранный список важных для поиска признаков и характеристик изображения. Такой способ позволяет качественно обработать как формальные свойства изображения, так и отразить его тематику. Благодаря четкой структуре описания обеспечивается достаточно высокая точность поиска. Если вам повезет найти по интересующей вас теме подобную специализированную галерею, эффективность поиска изображений вырастет в разы по сравнению с обычным универсальным поиском.
Не стоит забывать и про специализированные фотобанки. Профиль таких ресурсов может быть самым разным: от коллекций «обоев» для рабочего стола до коммерческих баз высококачественных фото, которые можно применять в полиграфии. Как правило, там используются стандартные режимы поиска, кроме того, для работы с такими базами существуют специальные поисковики.
Один из главных недостатков такой «каталожной» технологии – серьезные трудозатраты на описание ресурсов. Эпоха Web 2.0 дала новый толчок развитию данной модели. На социальных проектах задача описания загружаемых на сервер изображений полностью возлагается на их авторов. Кроме того, схема самого описания радикально упрощается. Вместо заполнения развернутой, но сложной анкеты предлагается схема свободного присваивания картинкам простых тегов. На некоторых ресурсах добавлять теги к изображениям могут не только их владельцы, но и другие пользователи сервиса Примерами ресурсов, где практикуется такой подход (его еще называют «фолксономией») при индексации изображений, могут служить Flickr, Photobucket и огромное количество других социальных фотохостингов.
Социальное индексирование изображений – способ хороший, однако не лишенный недостатков. Если в случае автоматического индексирования мы зависим от алгоритмов универсального поисковика, то здесь мы вынуждены полагаться на мастерство и добросовестность авторов. А индексаторская квалификация у владельцев картинок разная. У кого-то получается лучше, у кого-то хуже. Не надо забывать, что для описания близких по содержанию картинок разные авторы могут использовать различные ключевые слова. Кроме того, совершенно не факт, что автор картинки посчитает достойными индексирования именно интересные вам признаки. Свою роль может сыграть и фактор времени. Хорошо если человек загружает за один сеанс несколько фотографий – можно спокойно подумать над хорошим подбором тегов. А если таких снимков сотня? Скорее всего, всякий нормальный человек сэкономит время, в результате чего вся подборка будет описана всего несколькими общими тегами, и только некоторые фото удостоятся подробного описания. Такое сокращение поисковых признаков неизбежно сказывается на качестве будущего поиска.
Третья «генеральная» технология поиска, так называемая технология CBIR (Content Based Image Retrieval – поиск изображений по содержанию), делает ставку на системы автоматического распознавания изображений, которые работают напрямую с картинкой и индексируют такие ее параметры, как цвет, очертания изображенных объектов, их взаимное расположение.
Далее мы рассмотрим возможности поиска изображений с помощью вертикальных баз крупнейших универсальных поисковиков, попробуем определиться с качеством их поиска, а затем познакомимся с лучшими представителями семейства современных CBIR-поисковиков.
Для оценки качества работы универсальных поисковиков мы прибегнем к тестовому поиску по одинаковым запросам. Конечно, абсолютно исчерпывающим результат такого исследования не будет, однако предлагаемый подход хорош тем, что максимально приближен к повседневной работе и может быть легко воспроизведен: вам останется только подобрать собственные запросы из хорошо известной тематической области. Работать мы будем только с русским языком, а «семейные» фильтры отключим. Кроме того, тестовые запросы будут выполняться без входа в персональные аккаунты – в Google эта операция способна заметно повлиять на результаты выдачи.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКДанный текст является ознакомительным фрагментом.
Читайте также
Глава 4 Добавление изображений и мультимедиа
Глава 4 Добавление изображений и мультимедиа 4.1. Встраивание изображений4.2. Добавление мультимедиаПри создании сайта невозможно обойтись без использования активных объектов вроде Flash-анимации, видео или картинок. Так мы можем улучшить вид сайта, сделать его ярче,
Поиск и закачка игр, мелодий и изображений
Поиск и закачка игр, мелодий и изображений Если вы счастливый обладатель телефона, воспроизводящего какие-либо звуковые форматы (MID тоже в счет) и поддерживающего технологию Java, то вам непременно надоест однообразие картинок, мелодий и игр, изначально прошитых в «мозги»
Глава 21 Создание реалистичных изображений
Глава 21 Создание реалистичных изображений В процессе проектирования различных объектов большая часть графических работ приходится на формирование каркасных, поверхностных или твердотельных моделей. Отображение объектов на экране дисплея должно происходить быстро, в
Глава 13 Яркостная коррекция изображений
Глава 13 Яркостная коррекция изображений • Понятие гистограммы• Команда Brightness/Contrast (Яркость/Контрастность)• Команда Exposure (Экспозиция)• Команда Shadows/Highlights (Тени/Блики)• Команда Levels (Уровни)• Команда Curves (Кривые)Простейшая для понимания коррекция изображения –
Глава 14 Цветовая коррекция изображений
Глава 14 Цветовая коррекция изображений • Коррекция цвета командами коррекции яркости• Команда Color Balance (Баланс цветов)• Команда Hue/Saturation (Оттенок/Насыщенность)• Команда Photo Filter (Светофильтр)• Команда Match Color (Подбор цвета)• Обесцвечивание изображения• Специальные
Глава 23 Печать изображений
Глава 23 Печать изображений Документ, созданный в Adobe Photoshop, разумеется, можно распечатать. Более того, поскольку Photoshop – профессиональный графический редактор, он содержит много настроек, которые, как правило, не задействуются обычными пользователями, но жизненно
Глава 21 Создание коллекции изображений
Глава 21 Создание коллекции изображений Немаловажной частью работы фотографа является создание и организация коллекции изображений. Без надлежащего упорядочивания даже редчайшие и очень интересные кадры довольно быстро превратятся в беспорядочную груду, и найти
Глава 9 Добавление изображений
Глава 9 Добавление изображений Нередко документы Excel сопровождаются иллюстрациями. Это могут быть рисунки, просто украшающие документ, или графика, дополняющая информацию в таблице (фотографии, графики, схемы и т. д.). Из этой главы вы узнаете, как добавить на лист книги Excel
Глава 3. Способы получения изображений
Глава 3. Способы получения изображений Прежде чем начать работу над фотографией, вам необходимо получить исходный материал — изображение в цифровом виде. Существует множество способов получения таких изображений. В этой главе мы рассмотрим наиболее распространенные и
Глава 21 Создание реалистичных изображений
Глава 21 Создание реалистичных изображений В процессе проектирования различных объектов большая часть графических работ приходится на формирование каркасных, поверхностных или твердотельных моделей. Отображение объектов на экране дисплея должно происходить быстро, в
Глава 23 Создание реалистичных изображений
Глава 23 Создание реалистичных изображений Визуальные стили Настройка стиля отображения Подавление линий заднего плана Подготовка моделей для тонирования Пользовательские параметры тонирования Освещение Точечный источник света Прожектор Удаленный источник света
Глава 16 Создание реалистичных изображений
Глава 16 Создание реалистичных изображений В процессе проектирования различных объектов большая часть графических работ приходится на формирование каркасных, поверхностных или твердотельных моделей. Отображение объектов на экране дисплея должно происходить быстро, в
Глава 12 Поиск с предпочтением: эвристический поиск
Глава 12 Поиск с предпочтением: эвристический поиск Поиск в графах при решении задач, как правило, невозможен без решения проблемы комбинаторной сложности, возникающей из-за быстрого роста числа альтернатив. Эффективным средством борьбы с этим служит эвристический
Глава II Аналоговое представление изображений
Глава II Аналоговое представление изображений • Основы телевидения • Аналоговые видеоформаты Большинство компьютерных технологий длинных «родословных» не имеют. Стандарты на них и связанные с ними проблемы рождались буквально на наших глазах. Только компьютерное
Поиск изображений
Поиск изображений Искать изображения в Интернете легко. Нужно просто щелкнуть на ссылке Картинки в самой верхней строке Яндекса. В поле ввода открывшегося окна (рис. 2.7) ввести нужное ключевое слово. И в результатах поиска вы сразу увидите искомые изображения. Под каждой