Умные алгоритмы и беззащитные данные: что расскажет о вас цифровой след?

Автор: Анна Семенец, rosbalt.ru

23.05.2019 11:57

Умные алгоритмы и беззащитные данные: что расскажет о нас цифровой след?

Где мы оставляем свои цифровые отпечатки, кто собирает на нас досье, и почему алгоритмы, которые анализируют наши посты и лайки, должны быть открытыми, обсудили участники дискуссии «Цифровой большой брат» в рамках совместного цикла Фонда Егора Гайдара и Шанинки «Кризис человечности».

Как рассказал создатель главного российского BigData-алгоритма, генеральный директор Tazeros Global Systems Артур Хачуян, путешествуя по любым ресурсам в Сети, мы все оставляем свои следы. Это может быть пост, фотография, лайк, запись на прием к врачу. В будущем по этим цифровым отпечаткам, вероятно, можно будет восстановить человека: кто он, что ему нравилось, что он говорил в тех или иных ситуациях, считает он.

«По сути, это набор данных, которые остаются за человеком. Не все, далеко не все из них находятся в открытом доступе. Ведь по большому счету банковские и медицинские данные — это тоже цифровой след, но доступный только владельцу и оператору этих данных», — отметил Хачуян.

По его словам, в перспективе большие данные позволят копировать сознание. «Были такие научные разработки, и мы подобными вещами занимались», — отметил эксперт, добавив, это очень перспективное направление. «Благодаря подобным алгоритмам можно предугадать, какое действие совершит человек в реальном мире. Сейчас, конечно, данных для этого маловато, но есть уже огромное количество алгоритмов, которые на основании фотографии могут воссоздавать реальные снимки, или разговоры — на основе записанных ранее аудио», — отметил он.

Чтобы стать героем досье, сегодня совсем не обязательно быть потенциальным шпионом, заметил социолог, преподаватель Шанинки, эксперт Московского центра Карнеги Константин Гаазе.

Кто сейчас собирает данные о нас? Компании, которые занимаются решениями в сфере государственной безопасности, маркетинговые конторы, которым выгодно показать вам то, что вам интересно. «Но по факту сейчас алгоритмы ушли далеко вперед. Они не отвечают, они создают спрос. Вы еще беременны, а вам уже предлагают автокресло. С одной стороны, это совершенно безобидная история. Но по факту она немного пугающая, потому что завтра подобный алгоритм может и президента выбрать», — отметил Хачуян.

Кроме того, наши данные собирают сами провайдеры, социальные сети — Google, Facebook, которые предоставляют условно бесплатный сервис, и используют данные, которые мы там оставляем, для рекламных коммуникаций с нами же или прямой их продажи. «Это очень частая история. Вы что-то посмотрели на Youtube, к вашему обезличенному идентификатору привяжут эти социальные действия, а затем отправят на другую платформу», — рассказал эксперт. По его словам, в Сети немало ресурсов, на которые никогда не подумаешь. Например, одним из крупнейших владельцев рекламного трафика, отправляющим данные огромному количеству рекламных и маркетинговых сетей, считается Pornhub.

Помимо компаний, данные о нас собирают хакеры, которые часто взламывают пароли по контрольным вопросам, ответы на которые ищут в наших же аккаунтах в соцсетях. «Условный пример: в качестве контрольного вопроса вы выбрали имя питомца. Мы заходим к вам в Instagram и запросто его находим», — пояснил он. Так же просто сейчас ищется девичья фамилия матери.

По словам Хачуян, с большими данными связано очень много проектов по предотвращению преступности. В России уже были судебные прецеденты, когда на основании решения алгоритма суд принимал постановление о слежке за человеком.

«Самое страшное, что может произойти — изменение юридического механизма вменения в пользу алгоритмов. Это намного страшнее „большого брата“, — считает Гаазе. Но, по мнению Хачуяна, такого никогда не будет.

По словам эксперта, говоря о больших данных, важно разделять слежку со стороны спецслужб и реалии новой экономики, когда мы платим Instagram за бесплатный сервис теми действиями, которые совершаем внутри сети, тем самым позволяя ему зарабатывать на продаже наших данных и рекламы. Не менее важно разделять управленческие решения, принимаемые государством, и алгоритмы, помогающие ему. „Если завтра правительство захочет лишить всю молодежь, которая сходила на митинг, возможности получать бесплатное образование, если примет такое управленческое решение, оно исполнит его с большими данными и без. Хотя, конечно, нельзя отрицать, что с алгоритмами дело пойдет куда быстрее“, — заметил он.

По словам экспертов, большой объем информации машины получают, анализируя задний план на фотографиях, где могут быть не только здания, но и другие люди. А про детей они сегодня знают едва ли не больше, чем про взрослых. Уже к пятилетнему возрасту в Сети накапливается огромный массив персональных данных о них благодаря тому, что выкладывают родители — начиная со снимков УЗИ и заканчивая постами, фотографиями и видео, заметила в свою очередь культуролог, доцент Шанинки и креативный директор Фонда Егора Гайдара Оксана Мороз. То есть — очень большой объем информации о человеке алгоритмы собирают тогда, когда он сам еще не в состоянии ею поделиться, или это не входило в его планы.

По словам Хачуяна, в некоторых странах законодательство уже запрещает распространять данные о детях даже родителям. „В России родитель может дать и передать права на обработку персональных данных несовершеннолетнего, а в Европе нет. То есть, там ты своего ‚годовасика‘ не можешь заинстаграмить, как бы он тебе не нравился, и наверное это хорошо“, — заметил он.

Вне поля зрения машин остается лишь старшее поколение, которое практически не оцифровано. Их не просто нет в онлайне. Они жили в доцифровую эпоху, когда все их действия еще не могли быть записаны, поэтому все, что у нас есть — их воспоминания, которые по большому счету представляют собой их субъективное мнение.

Однако, по словам Хачуяна, с точки зрения создания профиля конкретного человека лишь 30-40% составляют данные о нем. Остальные 60% — данные его окружения. „Если мне с точки зрения алгоритма не хватит данных о вас, я также могу использовать данные вашего цифрового окружения. Хотя, действительно, старшее поколение имеет в этой истории бесспорное преимущество, особенно люди 60+, про которых практически ничего в онлайне нет, только внуки, которые с бабушкой сфотографировались“, — отметил он.

Возможности алгоритмов куда шире, чем можно себе представить, считает Гаазе. „Мы всегда относились к несбывшимся возможностям нашей жизни как к чему-то, чего не существует. Большие данные как алгоритм, структурирующий и описывающий все на свете, позволяет видеть реальность совершенно по-другому. Видеть не только то, что случилось, а все дерево решений целиком“, — отметил эксперт.

По его словам, теперь социальная жизнь — это не совокупность сбывшихся маршрутов, а совокупность всех возможных маршрутов вообще, которые определенным образом записаны, зафиксированы и сохранены. „Авария 30 лет назад — это нелепое стечение обстоятельств. Авария сейчас — как возможность — уже из некоторой точки видна. Ее вероятность может быть высчитана и более того — может быть сохранена“, — пояснил социолог. Поэтому социология цифровой эпохи — социология чего-то принципиально нового, считает он.

Вместе с тем, большие данные оставляют широкое поле для ошибок, отметил Хачуян. „Раньше социолог, условно, исследовал какие-то определенные параметры. Сейчас он может взять 20 тысяч различных параметров — от цвета попкорна, который предпочитает человек, до цвета волос его подписчиков, и найти между этим математическую зависимость. Но при этом никакой ‚содержательной‘ зависимости между этими фактами не будет“, — отметил он.

Здесь важно понимать, что алгоритм — это всегда только то, что вы в него заложили, будь то статистическая выборка или какое-то ваше личное видение, подчеркнул Хачуян. И он в любом случае получится не универсальным решением, а отражением поставленных задач.

„Я часто слышу истории в духе: мы решили внедрить большие данные в HR и оказалось, что алгоритм подбирает нам только белых 35-летних мужчин с высшим образованием. По факту же алгоритм построен на основании выборки этой компании, которая таких людей и берет на работу“, — отметил эксперт.

По словам Гаазе, Сноуден рассказал нам ровно про это. „ЦРУ написало алгоритм, который вычислял оперативников Аль-Каиды (террористическая организация, запрещена в России) в Пакистане по телефонным звонкам, действиям в соцсетях и геотегам. Семь из десяти оказались журналистами Аль-Джазиры и других СМИ, которые чаще других бывают в зоне боев, у которых оттуда шли звонки, у которых есть переписка с подозрительными почтовыми адресами, откуда они получали заявления террористов“, — отметил он.

Поэтому не нужно относиться к большим данным как к „большому брату“, считает Гаазе. „Это, конечно, ‚тварь‘, наделенная некоторой долей личности. Она по крайней мере может сделать свою копию в какой-то промежуток времени, и потом сравнить нынешнюю версию с тем, чем оно было. Но это не ‚большой брат‘. Это скорее очень странный ребенок, который принципиально последователен, выполняя то, что вы от него просите. В этом смысле он не является ни злом, ни благом“, — полагает эксперт.

Но вместе с тем, придется признать, что оператор селекции теперь никакая не судьба, и всеми совпадениями управляют алгоритмы, отмечает Гаазе. „Благо, что человек хочет пожениться? Наверное. Благо, что жену ему подберет алгоритм? Не знаю. Я просто говорю, что теперь это возможно. А завтра будет возможно еще лучше, потому что мы выделяем феромоны, которые содержат ДНК, и алгоритм сможет подобрать идеального генетического партнера. Я не луддит, я просто пытаюсь обозначить мгновенную экспансию границ возможного в этом мире“, — отметил Гаазе.

По мнению эксперта, новое общество предполагает возникновение новой этики. „Должно быть выдвинуто очень простое политическое требование, состоящее из двух пунктов, связанных друг с другом. Первое — не должно быть в работе с вашими личными данными закрытых от вас алгоритмов. Второе — не должно быть алгоритмов, принцип работы которых вы не понимаете. Все, что проходит это требование, — благо“, — считает он.

По словам Гаазе, один из крупнейших в мире инвестиционных банков Goldman Sachs, который в свое время скупил 30% неликвидного жилья в США и сдает его в аренду, написал алгоритм, который исходя из ваших постов в соцсетях и темпов выплаты по аренде, может расторгнуть с вами договор (это записано в нем). И я хочу знать, как работает алгоритм, который оценивает мое поведение в соцсетях, если в результате я могу лишиться жилья», — отметил он.

«Кстати, в Америке есть закон, обязывающий банк, если он использует алгоритмы при выдаче кредитов, объяснить — мы тебе кредит не дадим, потому что ты 20 раз в сториз опубликовала, как пьешь алкоголь. А вот в России такого закона нет», — заметил Хачуян.

По его словам, в разных странах принято законодательство о защите персональных данных, но нет ничего про манипуляцию алгоритмами. «Думаю, в ближайшие пять лет ничего такого и не появится по одной простой причине: такой хороший закон в короткий срок не напишешь, а если напишешь, он защитит людей, но повредит рынку. Алгоритмы Facebook — коммерческая тайна. Несмотря на то, что он такого же размера, как некоторые государства, он не обязан открывать внутренности своих алгоритмов никому, потому что защищен патентом. Соответственно, никто никогда не проверит, как это работает, и почему вы получили именно эту информацию. Государство это понимает. Поэтому вся эта история с регулированием — история не ближайшего будущего», — считает эксперт.

Подобная цифровая реальность с каждым днём становится всё более угрожающей. Недавно в Минкомсвязи заявили, что система персональных и биометрических данных россиян может быть дополнена номерами телефонов и адресами электронной почты. Плюс ещё один кусочек личной информации в большом цифровом мире. Кроме новостей о достижениях в сфере персональных данных, можно вспомнить немало примеров утечки этой информации. Месяц назад утекло более 2 млн персональных данных через отечественную систему госзаказа, а совсем недавно данные 49 млн пользователей Instagram оказались в открытом доступе. Всё это лишний раз доказывает, что в сфере персональных данных определённо есть что регулировать.

По инф. rosbalt.ru

МНОГИХ ЗАИНТЕРЕСОВАЛО:

Исследование: вода предотвращает инсульт. В каких количествах?

Американские исследователи проанализировали данные более 29 тыс. человек и обнаружили, что регулярное употребление обычной воды может заметно снизить риск инсульта. Эффект наиболее выражен у тех, кто пьет не менее 1,4 литра в день.

Чем и кому опасны дыни и арбузы?

Гастроэнтеролог Сергей Вялов отметил, что арбузы и дыни могут в некоторых случаях оказывать негативное воздействие на здоровье.

Не все понимают: тревога и апатия могут зарождаться… в кишечнике

При внезапной апатии, тревожности и раздражительности следует обратиться к гастроэнтерологу. Об этом заявил врач, автор Telegram-канала Злой доктор Филатов.

Полицейские смогут заглядывать в телефоны россиян?