Три метода сбора пользовательских данных, которые могут стать для вас неожиданностью

О приватности и защите данных говорят все — от рядовых пользователей до Европейского союза с их GDPR. Тем не менее информация о наших привычках и поведении в сети утекает как вода сквозь пальцы. И иногда мы просто не замечаем, как это происходит. Но предупрежден — значит вооружен, поэтому мы перевели статью Роберта Куинливана, автора блога OneZero, о трех неожиданных способах сбора данных пользователей.


Все, кто пользовался интернетом в течение последних 10 лет, наверняка знают, что компании собирают данные пользователей для настройки рекламы. Основные игроки на этом рынке Google и Facebook, кроме них есть несколько стартапов и небольших брокеров данных. И все они учитывают новые источники данных, например, интернет вещей.

Конечно, таргетированная реклама требует детального изучения аудитории для создания более точных профилей покупателей. И хотя эта система изначально была задумана для рекламы, эти сведения также используют судебные органы, правительственные учреждения и организаторы политических кампаний.

Методы сбора информации, представленные в этой статье, могут оказаться неожиданными для обычных пользователей. Конечно, обычный человек вряд ли удивится, узнав, что Amazon в курсе истории его покупок или поиска. А вот то, что Alexa записывает разговоры даже в неактивном состоянии, может стать неприятным открытием.


DNS

Первое, что происходит при вводе адреса сайта в браузер браузер устанавливает, где находится сервер.

Чтобы найти сервер, выполняется DNS-запрос на поиск. DNS (Doman Name System) — это реестр доменных имен и IP-адресов, ассоциируемых с каждым доменом. Если вы хотите увидеть его в действии, попробуйте ввести любой сайт в dnslookup.org.

Помните, что этот DNS-запрос происходит до того, как первый байт с хост-сервера будет отправлен обратно в браузер. Поэтому еще до того, как у вас загрузится содержимое страницы, DNS уже будет знать, на какой сайт вы пытаетесь зайти.

Google, который сам является крупным брокером данных, использует собственный популярный публичный DNS, расположенный по адресу 8.8.8.8. Google заявляет, что регистрирует IP-адрес для каждого запроса к своей DNS, но в своей политике конфиденциальности говорит, что «не соотносит и не объединяет информацию из своих временных или постоянных журналов с любой предоставленной вами личной информацией». Тем не менее возможности для этого есть, и Google, который, как известно, читает электронные письма пользователей для создания рекламных профилей, может изменить свою политику, не сообщая об этих изменениях пользователям.

Хотя многие запросы на контент в интернете шифруются с помощью HTTPS, DNS-запросы часто отправляются в виде открытого текста. Это означает, что история просмотров может быть легко перехвачена интернет-провайдером (ISP) или самим провайдером DNS.

Поддержание безопасности DNS становится все более распространенной, но, до тех пор пока это не станет универсальным стандартом, DNS будет источником информации о привычках пользователей, просачивающейся в компании, занимающиеся сбором данных.

Но даже если защищенный и зашифрованный DNS станет стандартом, возможность отслеживания IP-адресов останется, если они контролируются крупным брокером данных, таким как Google. Google все равно сможет соотнести IP-адрес с DNS-запросами и таким образом узнать о привычках пользователя, не перехватывая ни одного конкретного сеанса.


Местоположение (даже если его отслеживание отключено)

Допустим, вас заботит вопрос приватности, и вы решили отключить геолокацию на телефоне или ноутбуке. К сожалению, вас все еще довольно легко найти, даже если GPS выключен.

С устройством связан IP-адрес. Это числовой код, обозначающий ваше местоположение в интернете. IP-адреса используются для маршрутизации сетевого трафика и располагаются в диапазонах, выделенных интернет-провайдером. Когда вы подключаетесь к интернету, IP-адрес назначается вашему устройству в зависимости от того, откуда вы подключаетесь.

Основываясь на IP-адресе, относительно легко определить, в какой точке земного шара вы вышли в интернет, даже если функция определения местоположения отключена на устройстве. Есть более десятка веб-сайтов, предназначенных для проверки геолокации по IP.

Как правило, IP-адрес не изменяется при закрытии браузера или перезагрузке устройства. Если владелец ресурса зафиксировал ваше подключение к сайту, даже если вы не авторизовывались или не создавали учетную запись, действия на сайте могут быть привязаны к вам на основе IP-адреса.

Один из распространенных способов решения этой проблемы — использование VPN для маршрутизации трафика с вашего устройства на другой сервер, даже если он на другой стороне планеты. При использовании VPN ваш настоящий IP-адрес больше не используется для доступа к сайтам, поэтому местоположение не отображается. VPN также обеспечивают защиту персональных данных при подключении к общедоступной сети Wi-Fi, например, в кафе.


Интеллект вещей

В последние годы стали популярны домашние голосовые помощники вроде Alexa от Amazon, предоставляющие возможности поиска, схожие с Google. Но довольно быстро обнаружились проблемы с конфиденциальностью этих систем.

И Alexa лишь одна из первых в огромном потоке товаров для дома, объединенных понятием интернет вещей. Интернет вещей — это целый мир устройств, которые соединяются через домашнюю сеть Wi-Fi или в ближайшем будущем через 5G.

Может возникнуть резонный вопрос: зачем подключать холодильник к интернету? Конечно, концепция «умного холодильника» еще требует некоторой доработки, чтобы эти устройства начали массово покупать. А вот умные телевизоры, безусловно, уже завоевали рынок. Индустрия развлечений движется в направлении стриминговых сервисов, а расширенные продуктовые линейки позволяют создавать все лучшие решения для дома, и люди выбирают умное телевидение (Connected TV), чтобы использовать преимущества новых типов контента.

Некоторые модели Smart TV собирают данные о том, какой контент воспроизводится на вашем устройстве, и на основании этого предоставляют рекламодателям данные об аудитории.

Мотивация этих систем такая же, как и у любой системы таргетированной рекламы. Статистика о зрителях, традиционно получаемая из семей, которым платят за то, что они детально сообщают о своих привычках телесмотрения, расплывчата ​​и основана на очень небольшой выборке. Smart TV предлагает более точные данные о зрителях, давая подробное представление о привычках просмотра миллионов зрителей в реальном времени.

К сожалению, люди не всегда знают о таком варианте сбора данных. Во многих устройствах можно отключить эту функцию, но для этого придется изучить параметры каждой модели.

Интернет был разработан для открытого сотрудничества, но этот коллективный проект сбора данных противоречит конфиденциальности. Даже если вы избегаете прямого взаимодействия с брокерами данных, такими как Google и Facebook, и установили агрессивную программу блокировки рекламы в своем браузере, ваша интернет-активность все равно может быть зафиксирована неожиданными способами.

Чем больше у нас подключенных к интернету устройств и чем мы активнее в сети, тем больше слез из данных, которые мы оставляем за собой. Увеличенная пропускная способность 5G также позволит предоставлять больше потоковых услуг в реальном времени, что дополнительно увеличит объем данных. Когда 5G станет общедоступным, и устройства начнут поддерживать его по умолчанию, станет еще проще отслеживать местоположение и собирать данные о повседневных привычках пользователей.


Чем больше информации о себе мы создадим, тем больше будет возможностей для ее анализа. И к тому времени как упомянутые технологии станут общедоступными, общество должно решить, насколько неожиданные методы сбора данных для него приемлемы.

Другие хорошие статьи