Google Goggles – универсальный путеводитель Николай Маслухин

We use cookies. Read the Privacy and Cookie Policy

Google Goggles – универсальный путеводитель

Николай Маслухин

Опубликовано 23 июля 2010 года

Почему поиск в интернете должен быть обязательно текстовым? Похоже, этим вопросом и задались в Google Labs, в результате чего изобрели Google Goggles. Эта программка позволяет искать информацию об объектах, лишь наведя на них камеру. Googles попытается определить называние объекта и затем использовать его для поиска. Получается, по сути, универсальный помощник путешественника.

Google Goggles может определить по внешнему виду достопримечательности её название и выдать ссылку на «Википедию»; позволяет распознавать тексты афиш, надписей или меню и сразу выдать перевод текста (с недавних пор доступен перевод и на русский язык); узнавать картины, скульптуры и прочие произведения искусства и давать ссылки на подходящие описания; по обложке книги или диска определять автора и название, выдавая ссылки на рецензии; распознавать марки вин, автомобилей и логотипы компаний.

Звучит фантастично? Ровно до тех пор, пока не видишь, что программа действительно работает. Правда, лучшие результаты она показывает, только когда показываешь ей картинки из интернета (они и понятно — сравнение идёт с иллюстрациями, уже присутствующими в базе Google). А вот при фотографировании с натуры возникают трудности, связанные с подбором подходящего ракурса. К тому же, результаты выдачи сильно зависят от условий и места съёмки.

Так, к примеру, если фотографировать памятник Салавату Юлаеву (визитная карточка города Уфы), при снимке с монитора выдаются ссылки исключительно про сам город. А вот если тот же снимок сделать в непосредственной близости от постамента, к анализу картинки подключаются данные от приемника GPS, и программа выдает точное название памятника.

Распознавание объектов по снимку с монитора

Распознавание визиток. Не совсем верно расшифрована фамилия, зато контактные данные считаны верно. Информацию можно сразу же добавить в контакты (или перевести, если речь идёт о текстовом блоке)

Распознавание логотипов. Логотип определен правильно, причём в выдаче указан уже совместный с компанией Renault логотип

Чтобы проверить качество распознавания в условиях плохой освещенности, мы специально сфотографировали известный плакат «We Can Do It!». Несмотря на посредственное качество снимка, программе не только удалось опознать произведение и автора, но и в первых же позициях выдачи дать ссылку на статью в «Википедии».

Работа с нечеткими снимками

К сожалению, при всех достоинствах программы (включая полную бесплатность) есть у неё и большой недостаток — поиск осуществляется исключительно на английском языке. И если текстовый блок можно перевести прямо из программы, то названия логотипов, достопримечательностей, а также ссылки на ресурсы, выдаются на языке Шекспира.

К оглавлению