Microsoft Viewport: не голографично, но иммерсивно Юрий Ильин
Microsoft Viewport: не голографично, но иммерсивно
Юрий Ильин
Опубликовано 07 мая 2013
В конце апреля корпорация Microsoft анонсировала вакансию главного разработчика ПО для некоего проекта в рамках своего подразделения Startup Business Group. Соискателю сулят возможность переопределить способы общения между людьми (посредством телекоммуникаций, естественно), создавая возможность в буквальном смысле «виртуально присутствовать» в конференц-зале, например, физически находясь на другом конце света. Подразумевается, что с помощью такого виртуального двойника участник встречи сможет оглядываться по сторонам, поворачиваться к коллегам и даже перешёптываться с ними.
Само собой напрашивалось предположение, что речь идёт о голографических «аватарах» для телеконференций (тем более что в тексте вакансии прямо указывалось, что разработанные функции в дальнейшем планируется интегрировать в Skype). Собственно, ровно в таком ключе СМИ и блоги информацию и подали. Что было не совсем правомерно.
Около года назад стало известно, что в Microsoft Research ведутся разработки проекта под названием Viewport. В описании проекта говорится, что Viewport должен будет представлять собой полностью распределённую систему иммерсивной (то есть формирующей у каждого участника эффект присутствия друг друга) конференц-связи. Образ каждого участника захватывается посредством системы, включающей три цветные камеры, три инфракрасных камеры, а также два инфракрасных лазерных проектора, идентичных тем, что используются в Kinect. Интересно, что использовать Kinect с его собственными камерами не получается, поскольку, как отмечается в описании, синхронизировать между собой три таких контролера невозможно, а вдобавок они склонны мешать друг другу.
Риг для захвата образа участника телеконференции и получаемые изображения
Благодаря этим проекторам формируется точечный растр, с помощью которого затем в режиме реального времени реконструируется точная 3D-модель участника; для этого разработан специальный алгоритм, который позволяет в режиме реального времени представлять облик человека в виде разрежённого облака точек, причём для этого нужна лишь одна рабочая станция.
Схема кодирования человеческого облика в разрежённое облако точек
Один из ключевых новаторских аспектов в нашем подходе заключается в использовании разрежённого облака точек вместо многоракурсной стереосъёмки для реконструкции геометрии, что позволит значительно ускорить 3D-реконструкцию и рендеринг. Вдобавок мы представляем схему «виртуального рассаживания», при которой облака точек размещаются таким образом, чтобы сохранять то же расположение участников конференции относительно друг друга, какое имело бы место при встречах в реальности. Это достигается путём тонкой калибровки, вследствие которой строго поддерживается взаимное расположение взглядов участников.
Это облако точек, а также три цветовых видеопотока и три видеопотока, содержащих двоичные маски, полученные с помощью инфракрасных камер, передаются по сетям другим участникам виртуальной встречи — на их рабочие станции. На этапе приёма происходит разворачивание сжатых данных, при этом разрежённое облако точек интерполируется в плотное посредством алгоритма регрессии.
Двоичные маски используются для общего улучшения качества будущего изображения. Плотные облака точек затем преобразуются в треугольные меши. После этого запускается алгоритм размещения этих мешей в общем виртуальном пространстве. И три (или более) виртуальных двойника участников телеконференции внимательно смотрят друг на друга: положение глаз всех участников «виртуальной» конференции постоянно отслеживается, и виртуальное пространство, в котором происходит «встреча», рендерится для каждого из них с учётом перспективы, так что в точности воспроизводится и параллакс — изменение видимого положения «собеседников» относительно удалённого фона в зависимости от положения наблюдателя.
Схема расположения участников виртуальной телеконференции. Направление взгляда постоянно отслеживается
Не обойдена вниманием и аудиосоставляющая: разработчики проекта предполагают использовать алгоритмы пространственного позиционирования звука, так, чтобы усиливать иллюзию присутствия: голос каждого участника конференции должен будет исходить в точности из его виртуального рта.
В итоге каждому из участников конференции потребуются две рабочие станции, одна из которых занимается формированием «отправного сигнала» (то есть облака точек), а вторая — рендерингом. Разработчики проекта Viewport использовали машины, оборудованные сразу двумя шестиядерными серверными процессорами Xeon Six-Core X5690 с тактовой частотой 3,46 ГГц, оснащённые 24 гигабайтами памяти и видеокартами NVidia Geforce GTX 580. Топ-модели, в общем.
Подробное техническое описание проекта приводится в объёмном, изобилующем формулами документе, доступном здесь. Слово «голограмма» в нём не употребляется ни разу.
Может сложиться впечатление, что исследователи из Microsoft Research, сами того не желая, всем запудрили мозги. Но никакого обмана тут не было и в помине: журналисты ухватились за термин «голограммы», однако, к сожалению, речь тут идёт исключительно о конференциях в виртуальном пространстве, а не о встречах, где люди и высокодетализированные голограммы смогут сидеть за одним столом и в случае надобности перешёптываться друг с другом.
В связи с этим возникает вопрос осмысленности всей затеи. Microsoft, впрочем, далеко не единственная компания, которая работает в этом направлении: аналогичные прототипы уже представлены Hewlett-Packard (система Halo) и Cisco (Telepresence). Главным преимуществом своего Viewport Microsoft считает возможность точного позиционирования моделей так, чтобы сохранять взаимное расположение глаз собеседников: если им нужно смотреть друг на друга, то они смотрят друг на друга, а не в камеру, например.
Демонстрация прототипа Viewport
Интересен и другой аспект: Viewport предполагает, что в режиме реального времени формируются точные и высокодетализированные 3D-копии собеседников. На приведённом выше скриншоте, конечно, видно, что «виртуальные» собеседники представлены трёхмерной графикой, причём не идеального качества. Но Viewport — это всё ещё прототип. Интереснее всего будет посмотреть, что произойдёт через пару лет и насколько удастся сделать этих «виртуальных двойников» жизнеподобными.
Специалисты по компьютерной графике много лет бились над проблемой «зловещей долины»; в последние годы наметилось её преодоление, хотя бы и частичное.
И уж во всяком случае о том, чтобы конструировать полностью жизнеподобных компьютерных двойников любого человека в режиме реального времени, и речи не шло.
Получение «фотореалистичного» (видеореалистичного) 3D-изображения живого человека так, чтобы его невозможно было отличить от живого, с использованием относительно минималистичного набора инструментов (две рабочие станции вместо крупной рендерфермы) и в реальном времени — это и впрямь окажется прорывом. При условии, что проект будет реализован до конца.
К оглавлению
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКЧитайте также
NFC в метрополитене, далее везде Юрий Ильин
NFC в метрополитене, далее везде Юрий Ильин Опубликовано 24 июня 2010 года К концу года МТС обещает превратить мобильные телефоны в электронные билеты, по которым будут пускать в московское метро; плата за проезд будет сниматься прямо с телефонного
День рождения настоящего Pac-Man Юрий Ильин
День рождения настоящего Pac-Man Юрий Ильин Опубликовано 12 октября 2010 года 10 октября 1979 года свет увидела игра Pac-Man. С этой даты началось её триумфальное, продолжающиеся и поныне, шествование по миру — и по всем мыслимым и немыслимым игровым
CG Event 2010: стереоприятие Юрий Ильин
CG Event 2010: стереоприятие Юрий Ильин Опубликовано 14 декабря 2010 года CG Event 2010 закончился. Событие, которому даже, в общем-то, трудно подобрать какое-либо «типовое» определение, в этом году проводилось уже в восьмой раз. С 2007 года эти мероприятия проходили
Кирилл Фаенов о суперкомпьютерах и Microsoft Юрий Ильин
Кирилл Фаенов о суперкомпьютерах и Microsoft Юрий Ильин Опубликовано 23 декабря 2010 года - Вы возглавляете подразделение Microsoft Technical Computing. Как оно возникло? Насколько приоритетным является направление HPC и параллельных вычислений для Microsoft и почему? -
Как делают стереофильмы Юрий Ильин
Как делают стереофильмы Юрий Ильин Стереокино — весьма пожилое явление. Первые опыты в этой области производились ещё в конце XIX века. Британский первопроходец кинематографа Уильям Фриз-Грин пытался запатентовать метод съёмки и демонстрации стереофильмов,
РАО хочет в интернет Юрий Ильин
РАО хочет в интернет Юрий Ильин Опубликовано 09 июня 2010 года Министерство культуры Российской Федерации, а с ним ещё несколько министерств, включая Минкомсвязи, Минюст и Минфин, подготовили «предложения по созданию условий, способствующих успешной
"Яндекс" вложился в распознавание лиц Юрий Ильин
"Яндекс" вложился в распознавание лиц Юрий Ильин ОпубликованоЮрий Ильин Компания «Яндекс» впервые инвестировала в иностранную компанию, причём занимающуюся весьма перспективным направлением деятельности — распознаванием лиц на цифровых
Блог-разведка или HR-шпионаж? Юрий Ильин
Блог-разведка или HR-шпионаж? Юрий Ильин ОпубликованоЮрий Ильин Разработанное в Social Intelligence программное обеспечение автоматически сканирует Facebook, Twitter, Flickr, YouTube, LinkedIn, блоги и «тысячи других ресурсов» в поисках записей и фотографий, оставленных
За торренты предлагают штрафовать Юрий Ильин
За торренты предлагают штрафовать Юрий Ильин ОпубликованоЮрий Ильин В Московской городской думе созрела новая антипиратская инициатива, направленная в значительной степени против потребителей цифрового контента. Депутат Александр Милявский
AMD ликвидирует бренд ATI Юрий Ильин
AMD ликвидирует бренд ATI Юрий Ильин ОпубликованоЮрий Ильин Корпорация Advanced Micro Devices решила полностью отказаться от использования бренда ATI — по крайней мере, в своих будущих продуктах. В первую очередь это коснётся следующих представителей линеек
ARPAnet: начало и конец Юрий Ильин
ARPAnet: начало и конец Юрий Ильин Опубликовано 03 ноября 2010 года 29 октября 1969 года с компьютера SDS Sigma 7 в Университете штата Калифорния в Лос-Анджелесе на компьютер SDS 940 в Стэнфордском университете было передано первое текстовое сообщение — «LOGIN». Со
Nintendo и Microsoft: порознь во враждебные воды Юрий Ильин
Nintendo и Microsoft: порознь во враждебные воды Юрий Ильин Опубликовано 17 июня 2010 года Стереоскопия сегодня на подъёме. Тренд, заданный кинематографом немногим более года назад, изменил значение термина 3D. Понятие «3D-игры» тоже стремительно преображается,
Nokia возглавит выходец из Microsoft Юрий Ильин
Nokia возглавит выходец из Microsoft Юрий Ильин ОпубликованоЮрий Ильин Представители Nokia, крупнейшего в мире производителя сотовых телефонов, в пятницу объявила о новом назначении: новым генеральным директором становится Стивен Элоп, бывший большой
Павел Черкашин (Microsoft) об обновлённом Hotmail Юрий Ильин
Павел Черкашин (Microsoft) об обновлённом Hotmail Юрий Ильин ОпубликованоЮрий Ильин Microsoft постепенно разворачивает четвёртую версию (Wave 4) сервиса Hotmail. Что в ней будет нового и чем она будет отличаться от других подобных сервисов? — Об этом «Компьютерре»
Юрий Мильнер: Facebook станет всемирным социальным графом Юрий Ильин
Юрий Мильнер: Facebook станет всемирным социальным графом Юрий Ильин Опубликовано 27 мая 2010 года На конференции Techcrunch Disrupt в Нью-Йорке выступил глава компании Digital Sky Technologies (DST) Юрий Мильнер. Чем заинтересовал российский бизнесмен устроителей