Нужна ли анонимность демократическому информационному обществу?
Нужна ли анонимность демократическому информационному обществу?
Великий итальянский физик Энрико Ферми сразу после испытания первой американской атомной бомбы въехал на танке в оплавленную адским огнем 400-метровую воронку. В этот момент он не смог сдержать эмоций и воскликнул: «Какая прекрасная физика!»
«Какая прекрасная экономика!» — не раз могли бы воскликнуть великие экономисты, наблюдающие кризисы и дефолты современной рыночной экономики в разных странах мира.
«Какая прекрасная психология!» — очень скоро воскликнут великие психологи, признавая, что с помощью новых технологий в демократическом обществе даже дети могут запросто шантажировать своих родителей.
В конце ХХ в. скорость распространения специальных информационных технологий была очень высокой. С тех пор подсматривающее и подслушивающее оборудование быстро дешевеет, и уже очень скоро оно может превратиться в игрушку, доступную школьнику. В этом случае не только родители смогут контролировать, что делают их дети, но и дети получат возможность следить за воспитателями, учителями и родителями, тщательнее выбирать моменты для шалостей. Более того, дети, воспитанные Америкой в духе поощрения предпринимательства и не обремененные высокими моральными принципами, могут начать приторговывать информацией об окружающих их взрослых, не считаясь при этом с законами, защищающими право граждан на невмешательство в их личную жизнь. В этой связи авторитетные американские учёные-правоведы Д. Солов, М. Ротенберг и П. Шварц писали: «Если американцы будут с детства приучены к дефициту конфиденциальности, они будут считать это нормальным»[1].
С тех пор прошло почти 10 лет — целое поколение, если учитывать современные скорости распространения инноваций. Повзрослев и став избирателями, молодые американцы, привыкшие с малых лет к дефициту собственной конфиденциальности и привычно нарушающие чужую, пришли в бизнес и в администрацию президента Б. Обамы[2]. В результате проблемы сохранения конфиденциальности персональных данных только усугубились.
Складывается впечатление, что в сформировавшемся сегодня обществе конфиденциальность (анонимность) не нужна: механизм тщательно организованного, по-настоящему тайного голосования применяется крайне редко; не учтённых (медицинским страхованием) людей в США скоро будут штрафовать; через пять лет весь Нью-Йорк будет контролироваться летающими на дронах полицейскими видеокамерами[3]. Похоже, что по мере насыщения общества информационными технологиями, развития информационно-коммуникационного бизнеса и повышения доступности его разнообразных услуг для конфиденциальности в обществе просто не остаётся свободного места.
В самом деле, с одной стороны, у абсолютного большинства граждан информационного общества слишком мало возможностей для обеспечения конфиденциальности своей личности; с другой стороны, из «честных людей» в анонимности практически никто не заинтересован, поскольку она так или иначе ограничивает комфорт ежедневной жизни американцев. Образно говоря, «колесо вытеснения конфиденциальности (анонимности)» в современном американском обществе крутится всё быстрее, подгоняемое тремя мощными «двигателями»:
1. стремлением государства к прозрачности бизнеса (вынужденная мера борьбы с кризисами);
2. широким использованием со стороны бизнеса персональных данных рядовых пользователей (ведущее сегодня направление повышения эффективности рекламы);
3. требованием со стороны рядовых пользователей расширения транспарентности государства (обычные демократические требования).
Первому и третьему «двигателям» уже было посвящено достаточно много публикаций как на английском, так и на русском языке. В настоящей работе мы остановимся на том, как американский бизнес использует информацию о пользователях в социальных сетях.
Уже почти четверть века киберпространство развивается на основе принципов «свободы Интернета», в соответствии с которыми, с одной стороны, пользователю должна быть доступна имеющаяся в сети информация, а с другой — у него должна быть свобода самовыражения. Возникшее в начале XXI в. новое поколение глобальных сетевых технологий предложило пользователям принципиально новые инструменты, значительно превосходящие прежние. Такие технологии, безусловно, дали сильный толчок развитию экономики и общества в целом.
В США считают, что свободу самовыражения пользователей не надо ограничивать, ею надо пользоваться, в том числе извлекать прибыль из «неразумения и оплошностей», допускаемых всеми обитателями киберпространства. По нашему мнению, именно эта огромная масса различных «оплошностей», тесно связанных с проблемами информационной безопасности пользователей, и стала экономическим ресурсом для нового, современного этапа развития ИТ-бизнеса.
Среди такого рода «оплошностей» специалисты особо выделяют кражи и несанкционированное использование идентификационных и персональных данных. В настоящее время это приняло буквально тотальный характер, прежде всего из-за того, что преобладающее большинство пользователей киберпространства предпочитает получать интернет-услуги бесплатно, при этом опрометчиво соглашаясь на предоставление провайдерам своей персональной информации.
В результате сегодня часто бывает трудно понять, какой именно бизнес-стратегии следует та или иная Web-компания — «прямой», то есть отдающей приоритет предоставлению пользователям услуг по общению с окружающим миром, или «обратной», которая, наоборот, ориентируется на предоставление всему «миру» (например, рекламе, статистикам, полиции) услуг по получению информации о клиентах Web-компаний и её использованию в собственных интересах[4].
Facebook нацеливает рекламу на своих пользователей
Действительно, в конце 2012 г. газета Wall Street Journal сообщила о широком распространении продаж персональных данных о клиентах социальной сети Facebook[5]. Многое из услуг Facebook напоминает то, что уже ряд лет делают такие крупные игроки на рынке онлайновой рекламы, как компании Google и Yahoo!. Facebook также следует сложившейся в этой отрасли тенденции — помогает маркетологам «достигать нужных людей в нужное время и в нужном месте», как утверждает Г. Раджарам (Gokul Rajaram), руководитель рекламных проектов компании Facebook. Занимаясь этим,Facebook продолжает следовать своей стратегии балансирования между использованием данных потребителей для привлечения денег маркетологов-рекламщиков, с одной стороны, и соблюдением своих, данных потребителям и регуляторам обещаний сохранять конфиденциальность этих данных, с другой.
Согласно данным сайта Awareness, Inc.(http://www.awarenessnetworks.com), в 2012 г. сетевой социальный маркетинг назвали приоритетным направлением своей деятельности 70 % маркетологов. В том же году в США, по данным Yahoo!, более 93 % маркетологов планировали увеличить свои инвестиции в социальные сети. В целом на Западе социальными сетями, наиболее популярными для так называемого «корпоративного блогинга», считаются Facebook и Twitter: в этих сетях свои странички («аккаунты») имеют практически все успешные компании (более 95 %). Одну или несколько социальных сетей (Facebook, Twitter, Google+, LinkedIn, «ВКонтакте», «Одноклассники» и др.) уже используют для своего бизнеса больше половины российских компаний[6].
Компания Facebook испытывает сильное давление со стороны своих инвесторов, которые хотят превратить её в крупного игрока на рынке цифровой рекламы. В качестве стратегического направления выбрано повышение эффективности использования накопленной информации. В этой связи корпорация недавно разрешила маркетинговым фирмам прицельно адресовать свою рекламу на пользователей Facebook, используя при этом информацию их «профилей» (адреса электронной почты и номера мобильных телефонов), а также данные об их привычках просмотра других сайтов. Более того,Facebook разместила в Интернете собственную рекламу, сообщая участникам рекламного рынка о том, что она отслеживает поведение своих пользователей и вне границ социальной сети.
Речь идёт о том, что корпорация, следуя «обратной» бизнес-стратегии, ищет новые способы реализации своего главного актива — персональных данных о 900 млн. своих пользователей, а также об их «поведении» в сети (годовой доход Facebook от продажи подобной информации маркетологам электронной торговли уже оценивается на уровне 3,7 млрд. долл.).
Фактически Facebook предложила использовать свои богатейшие информационные хранилища для исследования зависимостей между личными «атрибутами» пользователей этой социальной сети и их поведением в различных онлайновых интернет-магазинах. По мнению маркетологов, знание такого рода эмпирических зависимостей позволяет существенно повысить эффективность целевого маркетинга (адресной рекламы).
Facebook настаивает на том, что он не продаёт рекламщикам индивидуальные данные пользователей, и даже не разрешает им видеть эти данные. Тем не менее, сторонники соблюдения конфиденциальности персональных данных (privacy) отмечают, что Facebook заслуживает специального наблюдения, поскольку эта компания располагает многократно большим объёмом чувствительной информации по сравнению с иными сетями, что резко повышает её потенциальные возможности.
Эта социальная сеть знает много о реальной идентичности своих пользователей. Если Google в большинстве случаев делает заключение о своих пользователях, опираясь на их поисковые «наклонности» и статистику посещения браузеров, то Facebook оценивает своих пользователей на основе добровольно сообщаемой ими персональной информации (имена, номера телефонов, вкусы, а также их взаимные неформальные отношения), которая оказывается весьма ценной для продвижения рекламы и усиления её воздействия на клиента.
Американской прессе стало известно, что начиная с сентября 2012 г. Facebook не менее 20 раз позволяла маркетологам, располагающим собственными списками электронных адресов и номеров телефонов, давать целевую рекламу на специальные группы пользователей Facebook,а Facebook только фиксировала случаи совпадения этих внешних данных с информацией пользователей, которую они ввели в свои «профили».
Магазины одежды, например, использовали услуги сети для целевого обращения к потребителю на основе данных об их прошлых покупках, или банк мог вести целевую рекламу именно на потребителей с высоким банковским балансом. Кроме того, Facebook начал также использовать идентификационные данные своих пользователей для экспериментов с продажами рекламы на других Web-сайтах и приложениях. Недавно, например,Facebook начал размещать рекламу на игровом сайте Zynga (ZNGA) (company.zynga.com)и в сентябре объявил, что начнёт размещать рекламу на третьей стороне приложений смартфонов. В обоих случаях он может таргетировать рекламу на определенных людей, поскольку они зарегистрированы и используют свои аккаунты (зарегистрированные электронные адреса) в Facebook.
По мнению аналитиков, эти эксперименты свидетельствуют о вероятном намерении компании Facebook учредить свою собственную рекламную сеть и таким образом сделать свою рекламу вездесущей как для обычного Интернета (ориентированного на стационарные компьютеры и ноутбуки), так и для мобильного, нацеленного на те смартфоны, планшетники и иные мобильные коммуникаторы, которые принадлежат пользователям других сетей.
В августе 2012 г. компания Facebook призналась в сотрудничестве с фирмой Datalogix— специализированной компанией по сбору информации (data-mining company), которая отслеживала эффективность размещаемой рекламы, а именно, ведет ли представленная на Facebook реклама к увеличению покупок рекламируемых товаров в реальных («офлайновых») магазинах пользователями этой социальной сети.
Datalogix собирала информацию об изменениях динамики продаж от розничных продавцов, выясняла, кто, где и какие товары покупал, а затем совместно с Facebook сопоставляла эту информацию с электронными адресами и иными данными пользователей этой социальной сети и таким образом выявляла тех, кто мог видеть рекламу этих товаров вFacebook. Исследование охватило около 50 разместивших свою рекламу на Facebook компаний и показало, что в 70 % случаев 1 доллар, истраченный маркетологами на рекламу в Facebook, приводил к росту продаж на 3 доллара. Эксперты рекламного рынка признали этот опыт Facebook заслуживающим тщательного изучения.
Некоторые из новых методов рекламы демонстрируют завидный успех. Онлайновый розничный обувной магазин Shoebuy, подразделение IAC/InterActiveCorp, в течении всего лета 2012 г. участвовал в тесте, позволившем маркетологам показывать рекламу пользователям Facebook, опираясь на информацию о том, что они искали в других электронных магазинах (в некоторых случаях такая информация даже фиксировала особенности просмотренной обуви). При этом Shoebuy размещал рекламу на Facebook, адресуясь только к тем членам сети, кто недавно просматривал сайт этого розничного магазина. Эксперимент полностью себя оправдал: шеф маркетинговой службы Shoebuy Дж. Келлер (JamesKeller) заявил, что расходы его компании на такую рекламу окупились по крайней мере семикратно.
Всё это было бы замечательно, если бы не вопросы о соблюдении конфиденциальности личных данных пользователей Facebook. В 2012 г. Информационный центр по вопросам электронной конфиденциальности (Electronic Privacy Information Center, EPIC) пожаловался в Федеральную торговую комиссию США (Federal Trade Commission) на методы ведения бизнеса Facebook, и в частности на её взаимодействие с Datalogix, связанное с рекламными услугами.
Эту жалобу консультант EPIC по вопросам защиты потребителей Д. Жакобс (David Jacobs) прокомментировал так: «Многие годы пользователи Facebook оставляли на страницах этой социальной сети свою информацию и понимали, что она позволяет обратиться непосредственно к ним. Однако до недавнего времени такие „целевые обращения“ исходили только от пользователей Facebook— они как бы были отделены от всего того, что происходит вне данной социальной сети, в том числе и в реальной жизни». Сейчас правила игры изменились: теперь, как оказалось, личные данные участников могут использоваться многими, что и стало причиной для жалобы.
EPIC утверждает, что Facebook нарушила своё соглашение с государственным регулятором, в соответствие с которым социальная сеть была обязана, во-первых, сообщать о всех фактах предоставления такого рода информации третьей стороне, и, во-вторых, иметь предварительное согласие на такую передачу от всех пользователей, кого эта информация касалась.
Со своей стороны, и Facebook, и Datalogix уверенно заявляют, что их бизнес полностью соответствует обязательствам, а потому жалоба EPIC безосновательна. При этом о сопоставлении данных с Datalogix утверждалось, что для работы с целевой рекламой Facebook не отслеживал самих покупателей. Схема работы включала третью маркетинговую компанию — Tell Apart Inc., которая фиксировала все случаи использования участниками Facebook браузеров онлайновых магазинов. В случаях посещения их сайтов TellApart Inc. действовала как рекламный брокер, автоматически предлагая купить (Datalogix) информацию для организации рекламы, ориентированной на этих участников Facebook.
Оставалась нерешенной проблема с наличием согласия участников Facebook на куплю-продажу их персональной информации. В свете этого руководителей сети более всего беспокоило, не сочтут ли пользователи предоставляемые услуги опасными и не откажутся ли они от Facebook ради сохранения своей конфиденциальности.
Страхи оказались напрасными. Абсолютное большинство людей, «мигрировавших в цифровое пространство», проводящих многие часы в социальных сетях и пользующихся в них удобными информационными услугами, не хочет знать о своей информационной небезопасности. Эти люди даже не задумываются о том, что их поведение в сети может раскрывать весьма чувствительную персональную информацию.
Абсолютное большинство пользователей отказываются от хостинга в защищенных структурах платного интернета и предпочитают бесплатный, они закрывают глаза на передачу своих персональных данных многочисленным коммерсантам и соглашаются подвергаться воздействию целевой (таргетированной) рекламы. Эти пользователи считают такую «халяву» выгодной. Они и знать не хотят, что доходы ИТ-компаний, генерируемые содействием онлайновой рекламе (т. е. в рамках «обратной бизнес-стратегии»), перекрывают их убытки от предоставления бесплатного доступа пользователей к программам и услугам в рамках «прямой бизнес-стратегии».
Как нам представляется, причина такой беспечности одна: к настоящему времени наиболее активными пользователями Интернета стали молодые люди в возрасте 15–25 лет, которые выросли в условиях дефицита конфиденциальности(см. начало статьи). Они посчитали нормальной сделкой поступиться частью своей конфиденциальности в обмен на бесплатные интернет-услуги, которыми они будут пользоваться, несмотря на то, что в целом социальным сетям не доверяют.
В самом деле, руководители Facebook очень скоро заметили, что пользователи продолжают «кликать» на целевую рекламу, и поняли это как то, что она им нравится. А потому Facebook продолжает собирать информацию о своих пользователях и продавать её торговым сетям, которые организуют прицельную работу с клиентом (targeting marketing).
О чем могут рассказать «цифровые следы» в Интернете
Итак, мы выяснили, что персональная информация, и прежде всего так называемые «профили» участников социальных сетей, подвергается пристальному анализу. А о том, как можно трактовать информацию о человеке, в своё время сказал кардинал Ришелье: «Дайте мне шесть строк, написанных честнейшим из людей, и я найду в них повод его повесить».
Это высказывание заставляет обратить особое внимание на методы анализа собранной цифровой информации. Как оказалось, такого рода анализом могут заниматься далеко не только торговцы обувью. В марте 2013 г. авторитетная американская газета Washington Post о публиковала заметку о том, что компания Amazon — один из крупнейших магазинов электронной торговли — будет помогать создавать частную сетевую инфраструктуру, способную помочь ЦРУ в работе c новыми информационными технологиями[7].
В этой связи уместно напомнить, что термин «информационные технологии» охватывает и программные продукты, в которых могут быть «зашиты» высокоэффективные научные и специальные методы, о которых абсолютное большинство наиболее продвинутых молодых пользователей даже не догадываются.
Сегодня такие важные виды человеческой деятельности, как взаимодействия (коммуникации) в социальных и профессиональных группах, развлечения, шопинг и сбор необходимой информации, во всё большей степени опосредуются цифровыми технологиями. Соответственно, поведение огромных контингентов населения, занятых такими видами деятельности, легко регистрируется и контролируется, создавая питательную среду для нарождающихся вычислительных направлений социологической науки[8], для новых видов услуг, таких, например, как персональные поисковые механизмы и рекомендующие системы[9], а также целевой онлайновый маркетинг[10].
Современные методы анализа содержащейся в «профилях» персональной информации с высокой вероятностью позволяют выявить возможных преступников. По этой причине в настоящее время маньяки стали избегать социальных сетей. Тех же, у кого нет «профиля» в социальной сети, кто хочет сохранить конфиденциальность своей персональной информации, будут подозревать ещё больше.
В своё время госсекретарь США Х. Клинтон заявила, что «честному человеку транспарентность не страшна, он не возражает против распространения информации о себе; на анонимности настаивают те люди, которым есть что скрывать от окружающих».
Так, немецкий психолог К. Мёллер считает, что отсутствие профиля в социальной сети Facebook позволяет предположить асоциальный характер человека: он либо что-то скрывает, либо у него вообще нет друзей, и значит, он асоциальная личность и вполне способен на преступление. А работодатели в Германии уже проводят предварительную проверку потенциальных сотрудников, используя информацию социальных сетей. Если же у человека нет профиля, то работодатели даже не рассматривают его кандидатуру. У норвежского серийного убийцы Брейвика не было профиля в социальной сети Facebook, так же, как и у Джеймса Холмса, убивавшего людей в кинотеатре американского города Аврора[11].
Конечно информация, которая может быть получена на основе анализа той или иной совокупности событий с помощью специальных статистических методов, является косвенной, она может носить вероятностный характер и с юридической точки зрения считается неполноценной (никакому маньяку на её основе обвинений предъявить нельзя). Тем не менее, такого рода информация может быть очень чувствительной для конкретного пользователя. Люди могут не желать обнародовать те или иные сведения о своей жизни, например свой возраст или социальную ориентацию.
Как оказалось, чувствительная информация может быть «предсказана» аналитическим путём на основе иных доступных индексов, фиксирующих поведение данного человека в сети. Например, крупнейшая в США сеть розничной торговли систематически анализирует данные о покупках молодых женщин с целью предсказания их беременности и посылает им свои коммерческие предложения, тщательно рассчитанные по времени и по своей целесообразности[12].
Информации о пользователях социальных сетей, которую можно «выловить» в Интернете, был посвящён доклад Психометрического центра Кембриджского университета «Предсказуемость особенностей личности на основе цифровых записей человеческого поведения», недавно опубликованный в «Трудах национальной Академии наук» (Proceedings for the National Academy of the Sciences)[13].
В докладе показано, как много могут рассказать о человеке пометки like(«нравится»), которые расставляют пользователи сети Facebook. В принципе пометки like подобны иным широко распространенным «цифровым следам» поведения пользователей в сети Интернет, таким, например, как «статистика использования браузеров» (browsing histories), «вопросы, задаваемые в поисковых системах» (search queries) или «история покупок в интернет-магазинах» (purchase histories). Однако пометки like отличаются от иных источников информации тем, что постоянно доступны «по умолчанию». Как оказалось, эти пометки представляют собой универсальный массив цифровой информации, подобный запросам в поисковых системах, протоколам посещения Web-сайтов или записям о покупках, сделанных по кредитной карте. На основе этого массива достаточно точно могут быть оценены многие чувствительные «атрибуты личности» от сексуальной ориентации до уровня интеллектуального развития.
Доклад демонстрирует эффективный пример применения в практической психологии хорошо опробованных методов статистического моделирования. В ней показано, как именно относительно простые, рутинные протокольные цифровые записи о действиях пользователя киберпространства могут быть использованы для автоматической оценки широкой палитры персональных характеристик («атрибутов»). Проводя в сети все больше времени, пользователи Facebook"клик за кликом" рисуют удивительно точную картину самих себя и не ощущают при этом того, что раскрывают свою конфиденциальную информацию. Авторы этого исследования честно признались, что специально выбрали те параметры, "наклонности" и "атрибуты" личности пользователей, которые в наибольшей степени иллюстрируют, насколько точными и настораживающими могут быть результаты их прогнозирования на основе общедоступной информации. Им удалось создать программу, достаточно точно "предсказывающую" не только пол и возраст пользователей, но также и такие высокочувствительные их личные данные ("персональные атрибуты"), как сексуальная ориентация, этническая и религиозная принадлежность, политические взгляды, личные наклонности, уровень интеллектуального развития и удовлетворенности своей жизнью ("уровень счастья"), употребление наркотиков, разобщенность родителей и проч. В общем виде схема проведенного исследования представлена на рис. 1.
Общая схема исследования
1) В Facebook были выбраны 58 466 добровольцев из США, которые согласились поработать с приложением My Personality Facebook (www.mypersonality.org/wiki) и расставить свои пометки like("нравится") на различных материалах (контенте), доступных в этой социальной сети: фотографиях, "друзьях", интересных страницах, спорте, музыке, книгах, ресторанах, популярных Web-сайтах и проч. В среднем каждый из участников расставил примерно 170 пометок, всего пометок удостоились 55 814 материалов, при этом абсолютное большинство из них отмечалось неоднократно, то есть разными участниками. По завершении работы с этим приложением оно содержало информацию об участниках, взятую из их "профилей Facebook", список расставленных ими пометок like, а также некоторую иную информацию.
Далее была сделана матрица "участник — пометка" (представлена на рис. 1 слева), составленная из строк, каждая из которых содержит пометки, поставленные одним участником. В клетку матрицы ставилась "1", если данный участник (строка) пометил данный материал (столбец) словом like, и "0" — в противном случае. Всего в такой матрице было проставлено около 10 млн. единиц (? 58466*170, то есть произведение количества участников на число помет).
2) На втором шаге размерность матрицы "участник — пометка" была сокращена с помощью формального математического метода "сингулярно-значимой декомпозиции" (singular-value decomposition, SVD)[14]. В результате исходная матрица была преобразована в матрицу "участник — компоненты" (представлена на рис. 1 в центре), у которой количество столбцов сокращено до 100 в соответствие с числом выделенных значимых факторов (компонент). Клетки этой матрицы заполнялись не "1", а специально рассчитанными "коэффициентами значения" той или иной компоненты.
3) На третьем шаге весь массив предсказываемых параметров ("атрибутов"), характеризующих каждого из участников, был разбит на три группы (на рис. 1 справа):
а) параметры, соответствующие профилю Facebook;
б) демографической "картине"
;в) проведенным тестам.
К группе а) были отнесены такие параметры, как возраст, пол, политические и религиозные взгляды, семейное положение, сексуальная ориентация, размеры и плотность личной социальной сети. В группу б) вошёл только один параметр — этническая принадлежность. В группу в) были включены психологические параметры, характеризующие индивидуальность личности человека по общепризнанной 5-факторной модели (невроз или эмоциональная стабильность, экстраверт или интраверт, открытость к новому опыту или закрытость, уступчивость или конфликтность, добросовестность или нет)[15]. В данной работе использовались данные по 5-факторной модели для 54 373 участников, полученные с помощью обобщения ответов на вопросы международного обследования[16].
Кроме того в группу в) попали оценки уровня интеллектуального развития[17], удовлетворённости жизнью[18] и статус взаимоотношений между родителями подростка до достижения им 21 года.
Для предсказания параметров каждой группы использовались различные методы. Для прогнозирования количественных параметров (возраста или уровня интеллектуального развития) использовались линейные регрессионные модели; для дихотомических параметров (пол или сексуальная ориентация) модели логической регрессии. В обоих случаях применялась 10-кратная перекрёстная оценка параметров регрессионных уравнений, построенных по 100 выделенным значимым факторам (SVD components). Для предсказания таких параметров, как сексуальная ориентация, статус взаимоотношений между родителями подростка, а также потребление алкоголя, наркотиков и сигарет, было выбрано 30 значимых факторов (из-за относительно небольшого количества представленной информации). Результаты предсказания дихотомичных "атрибутов" представлены на рис. 2.
Точность предсказания дихотомичных «атрибутов»
Сверху вниз:
— семейное положение (одинокий или нет);
— жили ли родители вместе до достижения подростком 21 года;
— употребление сигарет, алкоголя, наркотиков;
— являешься ли белым американцем или африканского происхождения;
— христианин или мусульманин;
— демократ или республиканец;
— являешься ли геем, лесбиянкой;
— пол.
Учёные обнаружили, что надёжнее всего данная методика различает пол участника (вероятность 93 %), а также его этническую принадлежность, точнее, является ли он белым американцем или африканского происхождения (вероятность 95 %). Далее, выяснилось, что, анализируя пометки like на предпочитаемых пользователями фильмах и телевизионных шоу (на фоне прочей информации), можно с 88-процентной точностью угадать сексуальную ориентацию мужчин и с 75-процентной — женщин[19]; с точностью 82 % определить христиан и мусульман; с точностью 85 % отличать американских "демократов" от "республиканцев". Достаточно высоким оказалось доверие в отношении употребления наркотиков, алкоголя и сигарет (примерно 70 %).
Оценивая это исследование, уместно вспомнить, что развитие методов предсказания тех или иных индивидуальных наклонностей и "атрибутов" личности на основе её различных проявлений (поведения) имеет долгую историю. Психологической науке давно известны работы, в которых в качестве исходных использовались такие материалы, как образцы письменного текста[20], ответы на специальные психометрические тесты[21] (например, обследование на "детекторе лжи") или анкетирование для выявления "ролевой функции" данной личности в среде её обитания[22].
Сегодня в психологической науке многое изменилось. Во-первых, если раньше особые и весьма специфические по своему характеру методы и методики применялись, как правило, немногочисленными высококвалифицированными профессиональными экспертами-психологами и только в рамках научных, медицинских и/или криминалистических исследований, то сегодня такие методы и методики стали доступны для использования в коммерческих целях и без каких-либо морально-этических ограничений. Во-вторых, если раньше такие методы и методики применялись для анализа малых выборок (примерно несколько сотен представителей), то сегодня они могут использоваться для классификации широких масс обитателей киберпространства (сотни миллионов и более).
И, наконец, в-третьих, если раньше реализация аналогичных по своему содержанию исследовательских проектов в области практической психологии (в частности, осуществление масштабных социологических опросов и обработка их материалов), сталкивалась с ограничениями из-за своей чрезмерной трудоёмкости и дороговизны, то теперь такая колоссальная по объёму работа становится дешёвой. Можно сказать, что "миграция" людей в цифровую киберсреду качественно упростила процедуры сбора и обработки первичной социо-психологической информации. В результате, психология как наука потеряла ореол "элитарности", а её весьма специфические методики стали доступны для свободного применения как в коммерческих, так и в политических целях[23]. При отлаженной методике, когда за исходными материалами никуда ездить не надо (их сбор, систематизация и обобщение запрограммированы и осуществляются автоматически), эту работу легко могут выполнять подростки, не отягощенные моральными ценностями правового демократического общества (см. начало статьи).
А информации, представляющей значительный интерес с точки зрения коммерческих приложений методов практической психологии, в современном киберпространстве уже накопилось много.
Как отмечалось в ряде опубликованных ранее работ, о возрасте, поле, месте работы, уровне образования и некоторых иных параметрах личности пользователя можно судить на основе тех "логинов", которыми он пользуется для входа на Web-сайт[24]. Другие параметры личности пользователя могут быть предсказаны на основе содержания его персонального Web-сайта[25], его музыкальной коллекции[26], а также данных из его "профилей" в Facebook или Twitter, содержащих информацию о количестве друзей, плотности дружеских сетевых связей[27] и месте (роли) самого пользователя в кругу его сетевых связей (как было установлено, это указывает на его сексуальную ориентацию)[28].
Таким образом, предсказывая персональную информацию с какими-либо благими намерениями, следует иметь в виду, что это может привести к разглашению и несанкционированному использованию личной информации, к опасному вмешательству в частную жизнь человека (нарушению его privacy).
О проблеме охраны конфиденциальности личности
В начале 2009 г. министр европейского правительства М. Кунева, выступая на Круглом столе по сбору данных, таргетированию и профилированию потребителей (Брюссель, 31.03.2009), сделала очень важный вывод: "Правовая защита персональных данных явно отстаёт от технологических и коммерческих возможностей их использования"[29]. Она стала первым официальным лицом, признавшим, что в настоящее время "персональные данные" стали реальным мотором коммерческого Интернета, "нефтью Интернета", "новой валютой цифрового мира".
Министр М. Кунева также отметила, что "одним из наиболее важных и наиболее противоречивых вопросов быстро развивающейся сферы цифровых коммуникаций является вопрос о взрывном характере увеличения объёма собираемых персональных данных и их использовании в коммерческих целях". Для современного бизнеса разработано целое "поколение" новых организационно-технологических приёмов, схем, методов, бизнес-моделей, практик и рекомендаций по изучению ("профилированию") потребителей (клиентов, конкурентов) и использованию добытой информации для "прицельной работы" с их уязвимостями.
В настоящее время работа по соблюдению конфиденциальности личности сосредоточена на исключении из общедоступного интернет-пространства такой персональной идентификационной информации, как реальное имя пользователя или его IP-адрес. Однако защита интересов потребителя требует гораздо большего.
На рынке появляется новое поколение потребителей, вооруженных технологиями и знаниями, разрабатываются удивительные инструменты социального поведения пользователей в сети, создаётся новая культура их общения в сети. У конкурентного бизнеса и рекламодателей нет другого выбора, кроме как быть вовлечёнными в эти пользовательские сети со специфической аудиторией и продвигать там свои товары и услуги с помощью новых сетевых технологий.
Однако при этом интересы бизнеса могут существенно расходиться с интересами потребителей, более того, с точки зрения такого противостояния, глобальная сеть все больше становится "миром дикого Запада" и может быть очень опасной[30].
Фактически Google, Facebook и другие онлайновые сервисные компании делают доступной для посредников ту часть персональной информации пользователей, которая в нормальной рыночной экономике не может быть для них доступна. Это касается регулярного доступа к конфиденциальным параметрам намеченных сделок (предмета, минимально приемлемой цены продажи и максимально допустимой цены покупки), что создаёт для посреднического бизнеса льготные условия информационного преобладания над клиентами, позволяющие систематически обыгрывать и первичного продавца, и конечного покупателя[31]. В массовом порядке такое информационное преобладание меняет "правила честной игры", подрывает сложившуюся информационную структуру рынка и может в целом дестабилизировать его.
Сказанное демонстрирует необходимость разработки и применения специальных мер государственного регулирования. Однако в том, какого типа должны быть эти меры — "предотвращающие" или "компенсирующие ущерб", мнения США и ЕС расходятся.
По мнению ЕС, ущерб лучше предотвращать, то есть нужно стараться защитить потребителя от несанкционированного раскрытия его персональной информации. По мнению М. Куневой, здесь не нужно ничего изобретать. Речь идёт о применении в цифровом мире хорошо известных принципов потребительской политики, проверенных в традиционном мире товаров и услуг. Это принципы транспарентности, четкой информации, отсутствия признаков монополизации рынка, справедливых коммерческих коммуникаций и справедливых контрактных условий, которые должны соблюдаться и при сборе персональных данных и при последующем их использовании в таргетированной рекламе. Соблюдение таких принципов будет содействовать повышению уровня доверия к коммерческим системам Интернета[32].
В США к нарушению прав соотечественников американское государство относится особенно трепетно. Однако упомянутые М. Куневой принципы, которые в Европе интернет-компании должны соблюдать при сборе и использовании "потребительских данных", встретили жесткое сопротивление как со стороны американского бизнеса, так и со стороны администрации президента Б. Обамы. Сотрудники министерства торговли США присоединились к мнению американского бизнеса, что упомянутые на встрече в Брюсселе правила защиты персональных данных пользователей Интернета "могут помешать инновациям и экономическому росту во всем мире, а также повредить способностям многонациональных корпораций и правительств вести трансграничную работу"[33].
Сотрудники администрации Б. Обамы утверждают, что они стремятся усилить защиту потребителей, но без удушения быстро растущих секторов экономики США. "Мы должны сохранить свободные потоки информации", — сказал Кэмерон Кэрри (Cameron Kerry), генеральный консул министерства торговли США, несколько раз побывавший в Европе в ходе обсуждения законопроектов по защите персональных данных[34].
Подход к этой проблеме делегации американских сторонников privacy, включавшей представителей "Американского союза гражданских свобод" (American Civil Liberties Union,ACLU), "Потребительской федерации Америки" (Consumer Federation of America) и "Центра цифровой демократии" (Center for Digital Democracy), в целом близок европейскому: privacy рассматривается в качестве фундаментального права граждан, и полиция отдельных стран должна иметь полномочия, чтобы контролировать сбор и использование персональных данных разными компаниями. И в США, и в Европе такой подход находит поддержку, в частности у тех, кто одобряет "многосторонний процесс" (multi-stakeholder process) решения трудных вопросов privacy. Этот подход ориентируется скорее на переговоры между бизнес-группами, адвокатами потребителей и другими заинтересованными сторонами, нежели на директивы правительства.
Оберегая такие сетевые корпорации как Google, Facebook,Yahoo! Microsoft, AOL и проч., администрация Б. Обамы, пошла только на то, чтобы призвать их добровольно внедрять Web-браузеры с опцией "не следить", позволяющей пользователям по своему желанию отключать слежку за их поведением в сети[35].
Стратегия лидеров крупного американского интернет-бизнеса опирается на принципы "легче всего грабить того, кто этого не замечает" и "не пойман — не вор". Такая стратегия предполагает, что государство не должно запрещать пользователям Facebook вести себя так, как они хотят, и состоит в том, что компания, предоставляющая сетевые услуги, соглашается не на предотвращение случаев нарушения конфиденциальности пользователей, а только на судебную ответственность по конкретным фактам нарушения гражданских прав.
При этом сбор и использование персональной информации граждан нельзя считать правонарушением, если эти действия осуществляются с согласия пользователей, зафиксированного в договоре о предоставлении услуг. Такой договор "заключается" при регистрации нового члена сети. Однако на изучение текста этого договора абсолютное большинство избалованных "быстрым Интернетом" пользователей время не тратит и "подписывает его в темную" (хотя и ощущают отмеченное М. Куневой недоверие). Широкой общественности известен факт, когда администрация одной из социальных сетей предлагала при регистрации пользователей заключать договоры на невыгодных для них условиях. Как оказалось, 175 млн. пользователей заключили такие договора, прежде чем один из них заметил в тексте договора подвох и обратился с жалобой! (Это позволяет предположить, что практически все нетерпеливые юные пользователи социальных сетей соглашались на условия предложенного им договора, даже не потрудившись его прочитать).
В рамках такого подхода функция государства заключается не в обеспечении реальной личной кибербезопасности граждан (то есть предотвращении использования персональных данных против интересов пользователей), а в обеспечении правоохранительных мер (law enforcement) на основании исков по конкретным нарушениям права конфиденциальности личности. Именно такой подход приобрел в США широкую политическую поддержку и полностью отвечает официальной позиции администрации Б. Обамы. Необычайно интенсивная компания её лоббирования была заметна и на встрече в Брюсселе. По данным Центра за ответственную политику (Center for Responsive Politics), такие корпорации, как Google, Facebook и Yahoo!за последние годы очень сильно нарастили свои лоббистские усилия и политическое давление. По данным этого центра, в 2012 г. бюджет лоббистской деятельности корпорации Google в Вашингтоне составил 18,2 млн. долл., то есть вырос почти в два раза по сравнению с 2011 г. и более чем в три раза по сравнению с 2010 г.
В 2008 г. перспективам защиты частной информации было посвящено весьма авторитетное специальное исследование, проведенное по инициативе Европейского парламента[36].
Широкое разнообразие атрибутов, предсказанных в данном исследовании, позволяет предположить, что с помощью предложенного метода и подбора соответствующего набора факторов можно достаточно точно предсказывать и многие иные составляющие персональных данных пользователей.
Предсказание индивидуальных атрибутов и преференций пользователей может применяться для совершенствования многих информационных продуктов и услуг. Например, такие цифровые системы и устройства, как онлайновые магазины или даже автомобили, могут с самого начала проектироваться таким образом, чтобы допускать возможность адаптации к поведению того или иного конкретного пользователя[37].
Кроме того, уровень релевантности товара маркетинговым рекомендациям можно повысить с помощью добавления в существующие модели пользователей психологического измерения. Современная реклама должна носить избирательный характер. Например, реклама онлайнового страхования должна делать акцент на безопасности, если она адресуется эмоционально нестабильному пользователю (невротику), и, наоборот, подчёркивать потенциальные угрозы, когда она обращена к эмоционально уравновешенному потенциальному клиенту. Маркетинговые схемы должны позволять болельщикам видеть рекламу билетов на предстоящие игры, а людям, изучающим испанский язык, видеть рекламу путешествий в Испанию или Мексику. Постоянным покупателям книг или одежды торговые Web-сайты рекомендуют новинки, разрешая им легко отслеживать свои заказы без регистрации каждого своего визита на сайт.
"Цифровые следы" поведения пользователей в сети могут стать удобным и надёжным способом построения их психологических портретов. Есть основания полагать, что методы раскрытия персональной информации пользователей Интернета уже в ближайшей перспективе будут интенсивно совершенствоваться. В этой области можно ожидать появления многих прорывных инноваций, позволяющих по косвенным признакам распознавать в незнакомом человеке ту или иную болезнь, наклонность или черту характера и таким образом лишать его анонимности (конфиденциальности).
Автоматические оценки, опирающиеся на большое количество примеров, не только точнее и объективнее, но и допускают сопоставление оценок во времени, что позволяет выявлять тренды.
Выводы, сделанные на основе зафиксированного цифровым способом поведения пользователей, могут быть полезны для повышения качества маркетинговых рекомендаций, а также способны открыть новые горизонты исследований в области психологии человека.
С другой стороны, прогнозируемость индивидуальных атрибутов пользователя на основе "цифровых следов" его поведения в сети может иметь существенные негативные последствия, поскольку легко может применяться в отношении большого количества людей без получения их индивидуального согласия и даже без их оповещения. Коммерческие компании, правительственные структуры или те же друзья по сети Facebook могут использовать соответствующие программы для оценки таких атрибутов, как "уровень интеллектуального развития", "сексуальная ориентация" или "политические взгляды" пользователей, которые они раскрывать не собирались.
Конечно, все предсказываемые оценки ("атрибуты") личности пользователей Facebook по самой своей природе носят вероятностный характер, а потому об их надёжности можно судить только в контексте проанализированной выборки. Однако, если эту объёмную выборку считать представительной, то результаты её аналитической обработки могут выглядеть весьма убедительными. Любой человек легко может себе представить ситуацию, когда такие оценки (даже неправильные!), создают реальную угрозу его благосостоянию, свободе или даже жизни. Может быть неожиданное предложение витаминов для беременных или специфической одежды и окажется своевременным. Однако в некоторых случаях такие предложения могут привести к трагическим результатам, например обнаруживая (или неправильно представляя) беременность незамужней женщины для её семьи[38].