Cognitive научилась отличать кошку от собаки Юрий Ревич
Cognitive научилась отличать кошку от собаки
Юрий Ревич
Вообще-то компания Cognitive Technologies собирала журналистов в гостинице «Алроса» 27 января на официальную пресс-конференцию по итогам года. Гвоздём программы, однако, стало не скучное перечисление достижений этого крупнейшего игрока на отечественном корпоративном рынке программного обеспечения. Самое интересное в деятельности Cognitive, в далеком 1993 году созданной на основе группы учёных — специалистов по искусственному интеллекту, — это технологии. И сейчас компания снова сумела удивить собравшихся.
Год назад специалисты компании уже демонстрировали программу, которая определяет авторство текста с такой же уверенностью, как эксперт-криминалист определяет принадлежность отпечатков пальцев. Как раз на днях технология семантического анализа текста, на которой основывалась та демонстрация, была продана «Яндексу». Пока можно только гадать, куда конкретно крупнейший российский поисковик собирается её приложить, но главное направление очевидно: это методы «понимания» содержания текстов, а следовательно, обеспечения лучшего их соответствия пожеланиям запрашивающего.
А на этот раз Cognitive показала свое умение решать классическую задачу "отличить кошку от собаки". В 1967 году известный советский кибернетик Михаил Моисеевич Бонгард опубликовал книгу " Проблемы узнавания ", посвященную проблемам теории распознавания образов. В этой книге в качестве приложения был помещён "Задачник для узнающей программы" — перечень из сотни задач распознавания ("тесты Бонгарда"). Характерной чертой этих задач было то, что они легко решаются человеком, но при этом не имеют чётких критериев для их описания в виде алгоритма.
Одной из этих задач и было — "отличить кошку от собаки", задача, которую любой ребенок, даже ещё не научившийся говорить, решает с полувзгляда. Если вы захотите поиграться в вопросы-ответы на эту тему, то быстро обнаружите, что любая черта, характерная для кошачьих (или, наоборот, собак), не может служить однозначным и стопроцентным критерием для отличия во всех случаях. Убираемые когти? Кошка может их выпустить в любой момент, но от этого мы её с собакой не перепутаем. Вертикальный зрачок? Кошку с зажмуренными глазами мы также легко отличаем. И так далее.
Представители Cognitive заранее предложили всем желающим принести изображения кошек и собак на флэшках, и на компьютере, установленном в холле гостиницы, где проходила пресс-конференция, демонстрировали работу программы. Ни одной ошибки сделано не было — программа уверенно (с соотношением 30:8) определяла собаку даже на фотографии лохматого шпица.
Демонстрация эта, по словам представителей компании, была лишь иллюстрацией к решению общей задачи классификации изображений. Пока не существует программ, с достаточной для практического применения уверенностью решающих даже простейшие задачи такого рода: например, выделить все женские портреты из некоторой галереи, или ещё проще — найти из всех картин только пейзажи.
Все реально работающие системы поиска и классификации изображений сводятся главным образом к анализу текстового контекста (как в поиске Google по картинкам), а если и пытаются что-то распознавать ( Face Search, Exalead и прочие), то по очень ограниченным критериям и с решительно недостаточной релевантностью результатов. Даже системы по элементарному поиску дубликатов одного и того же изображения нередко спотыкаются на простом изменении соотношения сторон при обрезке картинок. А про фиаско, которое потерпели системы выявления разыскиваемых лиц по изображениям, полученным от следящих видеокамер (вроде популярной некогда программы FaceIT), пресса писала неоднократно.
Переоценить последствия от нахождения общей методики распознавания изображений и отнесения их к одному из заданных классов сложно. Это переворот не только в обычном поиске по картинкам в Сети, но и в криминалистике, в научных приложениях (в геоинформационных системах, в биологии, в медицине), в военной области. Так что можно лишь пожелать компании всяческих успехов в этом направлении. Но заодно стоит и предостеречь от необоснованного оптимизма: как известно, и задачу машинного языкового перевода ещё полвека назад полагали почти что решённой. А как это работает на практике и по сей день, мы все хорошо знаем…
К оглавлению
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКЧитайте также
LED-революция Юрий Ревич
LED-революция Юрий Ревич По сведениям исследовательской компании Displaybank, предложение на рынке ЖК-телевизоров со светодиодной подсветкой (LED TV) растет по экспоненте. В прошлом году оно было ещё невелико, не более 3,6% от количества проданных экземпляров, но к
СМИ оказались равнее других Юрий Ревич
СМИ оказались равнее других Юрий Ревич Опубликовано 23 июня 2010 года Когда схлынут первые восторги по поводу окончательно принятого на прошлой неделе постановления Верховного Суда о СМИ (проект постановления бурно обсуждался ещё с апреля), и опять
Интернет в глуши Юрий Ревич
Интернет в глуши Юрий Ревич Есть у меня дорогая мечта — сделать своим основным местом проживания деревню, в которой моя семья уже скоро тридцать лет, как владеет домиком со скромным участком в 15 соток. Собственно, я и так в течение последнего десятилетия предпочитаю
Гувернеры для интернета Юрий Ревич
Гувернеры для интернета Юрий Ревич Опубликовано 14 мая 2010 года Тема «управления интернетом» у нас в стране сводится обычно к критике властей, когда они выдвигают очередной «закон об интернете», составленный, как правило, без доли понимания, «как все
Домен. РФ, торренты и все-все-все Юрий Ревич
Домен. РФ, торренты и все-все-все Юрий Ревич Компания RU-CENTER, самый крупный российский регистратор доменов и хостинг-провайдер, отметила свое десятилетие конференцией " Доменины-2010 ". Пересказывать все, что говорилось на конференции, бессмысленно, потому остановлюсь на двух
Политически корректные фильтры Юрий Ревич
Политически корректные фильтры Юрий Ревич Интерес публики к истории с так называемыми "фильтрами Петрика" вот уже более полугода непрерывно подогревается как одной, так и другой стороной. Идёт настоящая информационная война, реальная и даже почти демократическая по
Любовь к чтению Юрий Ревич
Любовь к чтению Юрий Ревич Событие уходящего года, которое мне хочется отметить в числе важнейших в IT-отрасли, по сути ещё не реализовано — это пока ещё не событие, а тенденция. Но тенденция эта, если ей будет суждено воплотиться в «железе», способна изменить наш
Плюс интернетизация всей страны Юрий Ревич
Плюс интернетизация всей страны Юрий Ревич Опубликовано 17 июня 2010 года 16 июня на встрече с премьер-министром Путиным министр связи Игорь Щеголев напомнил о том, что холдинг «Связьинвест» летом текущего года вводит так называемые социальные тарифы
За что провайдеры блокируют «Самиздат» Юрий Ревич
За что провайдеры блокируют «Самиздат» Юрий Ревич Опубликовано 28 мая 2010 года Эта история началась в апреле 2009 года, когда Череповецкий городской суд Вологодской области объявил экстремистом некоего Дунаева Виктора Анатольевича, что-то там не
Электронные книги: по стопам Гутенберга Юрий Ревич
Электронные книги: по стопам Гутенберга Юрий Ревич Опубликовано 24 мая 2010 года 2010 год уже называют годом «электронных читалок». Есть шанс, что изобретение Гутенберга, когда-то послужившее одним из отправных пунктов индустриальной революции,
Power — это сила! Автор: Юрий Ревич.
Power — это сила! Автор: Юрий Ревич. © 2004, Издательский дом | http://www.computerra.ru/Журнал «Домашний компьютер» | http://dk.compulenta.ru/Этот материал Вы всегда сможете найти по его постоянному адресу: /2006/121/280065/Если бы я был на месте врачей, я бы окружил медицину священным и таинственным
Внешние связи Автор: Юрий Ревич.
Внешние связи Автор: Юрий Ревич. © 2004, Издательский дом | http://www.computerra.ru/Журнал «Домашний компьютер» | http://dk.compulenta.ru/Этот материал Вы всегда сможете найти по его постоянному адресу: /2006/121/280021/Как известно, компьютер состоит из процессора и памяти (последняя вполне может быть
На твердую память Автор: Юрий Ревич.
На твердую память Автор: Юрий Ревич. В 1999 году на предприятии, где я тогда трудился, встал вопрос о приобретении фотокамеры, которая могла бы без перезарядки сделать порядка нескольких сотен снимков. Максимальная емкость доступных карт для цифровиков была тогда 32 Мбайта,
Компромисс Автор: Юрий Ревич.
Компромисс Автор: Юрий Ревич. © 2004, Издательский дом | http://www.computerra.ru/Журнал «Домашний компьютер» | http://dk.compulenta.ru/Этот материал Вы всегда сможете найти по его постоянному адресу: /2006/120/276457/Одновременно с окончанием школы я перешел с советской «мыльницы» «Смена-8M» сразу на
Полмиллиона статей в Википедии — это много или мало? Юрий Ревич
Полмиллиона статей в Википедии — это много или мало? Юрий Ревич Я очень положительно отношусь к «Википедии», часто ею пользуюсь, уважаю людей, которые этим проектом бескорыстно занимаются (среди них есть мои друзья), и в первых же строках хочу искренне поздравить их с
Загорская ГАЭС — фоторепортаж Юрий Ревич
Загорская ГАЭС — фоторепортаж Юрий Ревич Случилось мне тут побывать на IV всероссийском совещании гидроэнергетиков. О самом Совещании я рассказывать на этих страницах не буду (о нем достаточно наговорили информационные агентства и специализированные издания), но в