Анонимизированные данные

Что произошло?

Компания Mail.ru Group, принадлежащая структурам Алишера Усманова и владеющая одноименным сайтом, а также соцсетью «Одноклассники», завершила сделку по покупке у фонда UCP 48% «ВКонтакте». Теперь 100% крупнейшей российской социальной сети принадлежит Mail. Ru

Как это получилось?

Mail.ru Group потратила год на то, чтобы завладеть 100% «ВКонтакте». Сперва основатель соцсети Павел Дуров продал в декабре 2013 года свои 12% гендиректору «Мегафона» (имеющего общего с MRG владельцев) Ивану Таврину, а тот через три месяца перепродал долю Mail.Ru. 48% «ВКонтакте» оставались в руках фонда United Capital Partners (UCP) Ильи Щербовича. Как стало известно в начале сентября, переговоры между ним и Mail.Ru находятся в финальной стадии, вопрос был только в том, кто приобретет долю UCP: был вариант, что это сделает — как и в случае с 12% Дурова — дружественная Mail.Ru Group фирма.

Зачем была нужна сделка?

UCP и Mail.Ru владеют одинаковым количеством мест в совете директоров, но при этом не могут договориться по многим важным вопросам: до сих пор, к примеру, у соцсети не назначен новый генеральный директор. Кроме того, между UCP и MRG (а также Павлом Дуровым) более года продолжается конфликт. Сперва Mail.Ru и Дуров обвинили UCP в незаконности приобретения фондом своей доли в соцсети, затем сам UCP заявил о том, что Дуров использует ресурсы «ВКонтакте» на развитие мессенджера Telegam. Наконец, в июне стало известно, что Павел Дуров судится с UCP в США, так как считает, что фонд через бывших партнеров создателя «ВКонтакте» вымогает у него Telegram. Вместе с новостью о заключении сделки стало известно, что и Дуров, и Mail.Ru, и UCP договорились снять претензии друг к другу.

Обновлено, 22:30: Газета «Известия» сообщает, что фонд UPC отказался от претензий к Telegram и отказался от дальнейшего судебного разбирательства с Дуровым. Это означает, что компания, владеющая мессенджером (Telegram LLC), полностью переходит под контроль его создателя. Павел Дуров подтвердил Apparat эту информацию.

Как Google анонимизирует данные

Анонимизация представляет собой способ обработки данных, целью которого является удаление или преобразование идентификационной информации так, чтобы по полученным данным нельзя было определить, к какому именно лицу они относятся. Анонимизация является одним из важнейших методов, позволяющих компании Google обеспечивать конфиденциальность данных пользователей.

Анализ анонимизированных данных позволяет компании Google разрабатывать полезные и безопасные сервисы и функции, такие как автозаполнение в поиске, и эффективнее выявлять проблемы с безопасностью (например, находить фишинговые и вредоносные сайты). Кроме того, при необходимости мы можем передавать анонимизированные данные третьим сторонам. Во всех случаях обеспечивается надежная защита личной информации пользователей.

Ниже представлены сведения о двух методах, которые мы используем для защиты данных пользователей.

Обобщение данных

По некоторым свойствам информации легче определить, к кому она относится. Для защиты пользователей мы удаляем определенные элементы данных или подставляем вместо них общие значения. Например, при обобщении мы можем заменять фрагменты кодов городов или телефонных номеров на одинаковые сочетания цифр.

Обобщение данных позволяет нам обеспечить k-анонимность. Под этим термином в отрасли понимается метод, с помощью которого можно скрыть персональную информацию нескольких лиц в наборе данных, если эти лица похожи друг на друга. Буква k определяет число лиц в группе. Считается, что набор данных обладает k-анонимностью, если для каждого лица в группе имеется по меньшей мере k-1 лицо, обладающее такими же свойствами. Предположим, в наборе данных представлены почтовые индексы, а значение k равно 50. Если наугад выбрать любое лицо, то можно будет найти ещё 49 человек с тем же почтовым индексом. Это значит, что найти в этой группе конкретное лицо только по почтовому индексу невозможно.

Если всем лицам в наборе данных присвоено одинаковое значение того или иного атрибута, то для доступа к конфиденциальной информации достаточно знать, что все такие лица относятся к этому набору данных. Избежать подобных рисков позволяет принцип l-разнообразия. Этот термин применяется в отрасли для описания уровня различий в значениях, относящихся к конфиденциальным данным. Предположим, несколько человек одновременно выполняют поиск сведений, которые относятся к одной и той же конфиденциальной теме (например, по запросу «симптомы гриппа»). Благодаря k-анонимности в связанном с этими пользователями наборе данных нельзя выделить информацию по конкретным лицам, выполнявшим поиск. Однако принципы конфиденциальности могут быть нарушены, поскольку каждому лицу из этой группы свойственен признак, который является конфиденциальным (тема поиска). Принцип l-разнообразия предполагает, что защита информации пользователей будет обеспечена, если в анонимизированном наборе данных есть сведения о лицах, которые выполняли поиск не только по теме гриппа, но и по другим вопросам.

Добавление математического шума к данным

Ещё один распространенный в отрасли термин – дифференциальная приватность. Он обозначает метод добавления к данным математического шума. Благодаря дифференциальной приватности нельзя точно определить, представлено ли конкретное лицо в наборе данных: результат применения алгоритма будет практически одинаковым, независимо от того, включен ли этот пользователь в набор данных. Предположим, мы изучаем общую тенденцию поисковых запросов, связанных с гриппом, в определенном регионе. Чтобы соблюсти принцип дифференциальной приватности, в набор данных добавляется математический шум. В этом случае можно добавить или исключить определенное число пользователей, ищущих сведения о гриппе и относящихся к определенному району, но это не скажется на общей тенденции по всему региону. Необходимо учитывать, что при добавлении математического шума эффективность набора данных может снизиться.

Наряду с анонимизацией мы применяем ряд других методов для защиты конфиденциальности личных данных. В их число входят средства управления доступом к данным пользователей, правила объединения наборов данных, при котором может быть раскрыта личность отдельных пользователей, а также централизованная проверка стратегий анонимизации и управления данными. Благодаря этим методам обеспечивается эффективная защита личной информации пользователей во всех сервисах Google.

МОСКВА, 7 фев — РАПСИ. Арбитражный суд Москвы назначил техническую экспертизу по спору социальной сети «ВКонтакте» и Double Data (ООО «Дабл») о «прекращении использования открытых данных пользователей для продажи своих услуг», говорится в определении суда.

Столичный арбитраж предложил эксперту частного экспертного учреждения «Городское учреждение судебной экспертизы» ответить на 59 вопросов.

В частности, специалист должен выяснить, позволяют ли команды, записанные в исходном тексте предоставленных эксперту программ, извлекать (переносить содержание), копировать, хранить полученные в результате осуществления поиска материалы из базы сети «ВКонтакте»?

Также он должен предоставить суду информацию: по какому адресу в интернете расположен сервер, включающий информационный носитель, на который переносятся (копируются, записываются) материалы или часть материалов, составляющих базу данных пользователей «ВКонтакте»?

Арбитраж обязал стороны обеспечить доступ эксперта к серверам, предоставить исходные, объектные коды, ключи и иные сведения, необходимые для ответа на поставленные вопросы.

Суд по интеллектуальным правам 24 июля 2018 года отменил все судебные акты по этому делу, отправив его на новое рассмотрение в суд первой инстанции.

Столичный арбитраж 12 октября 2017 года отклонил иск.

Однако апелляция 6 февраля 2018 года удовлетворила требование социальной сети к ООО «Дабл» о «прекращении использования открытых данных пользователей для продажи своих услуг». Было оставлено без изменения решение первой инстанции в части отказа истцу в обязании ответчика уничтожить со всех информационных носителей информационные элементы, ранее извлеченные из базы данных пользователей сети «ВКонтакте», и взыскании 1 рубля компенсации.

Соцсеть ранее сообщила, что Double Data извлекает из базы данных «ВКонтакте» информацию (имена, фамилии, сведения о месте работы и учебы, фото), хотя истец и его пользователи не давали разрешения на извлечение таких материалов и их коммерческое использование.

Исковое заявление 31 января 2017 года было направлено в суд к двум ответчикам. Как считает истец, Национальное бюро кредитных историй (НБКИ), ранее выступавшее вторым ответчиком по спору, предлагало кредитным организациям сервисы на основе технологий, разработанных Double Data, что позволяет оценить кредитоспособность заемщиков по данным из сети «ВКонтакте».

Суд 15 августа 2017 года прекратил производство в части требований «ВКонтакте» к НБКИ в связи с заключением мирового соглашения. В соглашении, утвержденном судом, отмечается, что НБКИ в рамках правоотношений с ООО «Дабл» основывалось на гарантиях и заверениях правомерности использования ООО информации из социальных сетей, в т.ч. социальной сети «ВКонтакте».

Кроме того, «не давая оценки требованиям «ВКонтакте», изложенным в исковом заявлении, НБКИ, тем не менее, обязуется не использовать технологии и продукты третьих лиц, а также собственные технологии и продукты, функционирование которых основано на извлечении информационных элементов из базы данных истца без соответствующего его разрешения», говорится в соглашении.

Согласно мировому соглашению, «НБКИ обязуется изменить свои правоотношения с ООО «Дабл» таким образом, чтобы они не нарушали права истца, либо прекратить их».

ООО «Дабл» специализируется на создании программных продуктов, в основе которых лежат собственные методы и алгоритмы для поиска, хранения и интеллектуального анализа больших объемов данных (Big Data и Data Mining).

НБКИ консолидирует кредитную информацию, предоставленную банками, микрофинансовыми организациями (МФО), кредитными потребительскими кооперативами (КПК), ломбардами и другими кредиторами. В НБКИ хранятся сведения практически обо всех заемщиках, имеющих действующие или уже погашенные кредиты, проживающих в крупных городах страны и небольших населенных пунктах.

Компания ООО «Дабл» осуществляет свою деятельность с 2012 г. и специализируется на создании
программных продуктов, в основе которых лежат собственные методы и алгоритмы для поиска, хранения
и интеллектуального анализа больших объемов данных (Big Data и Data Mining).
Решения компании направлены на снижение просроченной задолженности и выявление мошенничества
в розничном кредитовании за счет использования новейших технологий и встраивания их в существующие
банковские бизнес-процессы.
За 2013 и 2014 годы компанией успешно реализовано более 100 проектов с Банками (среди которых
банки Топ-5, Топ-10), бюро кредитных историй, МФО и агентствами по взысканию задолженности.
Технологии Double Data разрабатываются совместно со специалистами:
Weierstrass Institute for Applied Analysis and Stochastics Leibniz Institute, Berlin;
Института проблем передачи информации им. А.А. Харкевича Российской академии наук;
Московского Физико-Технического Института (Государственного Университета).
Технологический уровень решений компании был подтвержден Фондом Сколково:
с начала 2014 года Double Data является резидентом кластера Информационных Технологий Фонда.
Double Data профинансирована венчурными фондами с широким опытом в Data management,
финансовой сфере и разработке B2B программных решений.

Основатели компании

  • Максим Гинжук
    Генеральный директор
    и основатель

    7 лет опыта венчурных инвестиций, создания новых
    технологических компаний и управления ими в ВТБ Капитал
    и ВЭБ-Инновации. Являтся основателем глобальной программы
    для предпринимателей Startup Leadership Program в России.
    МФТИ (Факультет Инноваций и Высоких Технологий)

  • Павел Шувалов
    Технический директор
    и основатель

    7 лет опыта разработки ПО в области информационной
    безопасности, анализа данных, создания высоконагруженных
    систем и поисковых технологий. Кандидат физико-математических
    наук в области высокопроизводительных вычислений.
    МФТИ (Факультет Общей и Прикладной Физики)

Double Data объединяет талантливых сотрудников с богатым опытом создания сложных информационных систем, которые не боятся
нестандартных задач. Используя передовые технологии для сложных, высоконагруженных и надежных систем, мы создаем простые,
нужные и понятные клиентам продукты.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *