AnyBlog.net

AnyBlog.net @AnyBlog

Смартфон не шпионит, но следит: правда о сборе данных смартфонами


Почему социальные сети демонстрируют рекламу, словно улавливают мысли пользователей? Почему случайно произнесённая фраза может привести к тому, что тематический контент будет появляться в течение нескольких последующих дней? Существует ли действительно тотальный контроль со стороны технологических компаний? Предварительный вывод: прямого прослушивания пользователей не происходит. Однако методы сбора данных оказываются значительно более сложными и масштабными, чем предполагалось ранее.

Происхождение теории о прослушивании смартфонов

Утверждение о том, что смартфоны постоянно записывают и анализируют разговоры пользователей, является одной из самых устойчивых теорий в цифровой среде. Сценарий, при котором обсуждение бытовой темы, например покупки инструмента, сопровождается почти мгновенным появлением соответствующей рекламы, воспринимается как подтверждение данной гипотезы.

Подобные совпадения вызывают обеспокоенность и способствуют распространению мнения о том, что крупные технологические компании, включая Facebook, Google и Apple, осуществляют скрытую аудиофиксацию частных разговоров с последующей идентификацией ключевых слов и персонализированным таргетингом. При этом публично представители данных корпораций неоднократно опровергали возможность такой практики.

Однако на текущий момент отсутствуют надёжные технические доказательства постоянного и систематического прослушивания пользователями смартфонов. Тем не менее, повсеместное развитие алгоритмов обработки и анализа данных позволяет достичь высокой степени персонализации рекламы без использования аудиозаписей, что вызывает у части аудитории опасения, сопоставимые с концепцией «Deus Ex Machina».

Расследование 2024 года и система Active Listening

В 2024 году был опубликован журналистский материал, содержащий информацию о потенциальных механизмах прослушивания пользователей с целью повышения эффективности рекламных алгоритмов. Сайт 404 Media опубликовал расследование, в котором утверждается, что медиагруппа Cox Media Group (CMG) вела разработку технологии под названием Active Listening.

Согласно опубликованным документам, система Active Listening предназначалась для извлечения так называемых «данных о намерениях в реальном времени» с использованием микрофонов мобильных устройств. Эти данные затем анализировались с помощью нейросетевых алгоритмов и сопоставлялись с другими поведенческими параметрами для генерации высокоэффективной рекламной выдачи.

Принцип функционирования системы оставался недостаточно прозрачным. Аналогично тому, как почтовые сервисы автоматически фильтруют входящие сообщения, Active Listening предположительно могла классифицировать аудиоинформацию без участия человека. Публикация вызвала общественный резонанс, после чего большинство технологических компаний поспешили заявить об отсутствии связей с CMG. В частности, Amazon официально опровергла сотрудничество, а Google и Meta приостановили любые партнёрские отношения.

В дальнейшем представители CMG заявили, что разработка продукта Active Listening была прекращена с целью недопущения искажённого общественного восприятия.

Active Listening и механизмы активации прослушивания

Согласно открытым источникам, технология CMG не предусматривала круглосуточную активацию микрофона на смартфоне. Вместо этого система функционировала на основе активации по ключевым словам, аналогично современным функциям голосовых ассистентов, таким как «Привет, Google» или «Привет, Siri». Сам факт существования подобной технологии вновь актуализировал общественные опасения по поводу потенциального слежения через мобильные устройства.

Важно разобраться в технических аспектах этой темы. Один из показательных примеров — эксперимент, проведённый несколько лет назад.

В 2019 году компания Wandera, специализирующаяся на мобильной кибербезопасности, инициировала исследование, целью которого было определить, может ли смартфон постоянно фиксировать и анализировать личные разговоры пользователей. Результаты оказались неоднозначными: с одной стороны, гипотеза о постоянной прослушке не подтвердилась, однако методы сбора данных, используемые крупными цифровыми платформами, продемонстрировали высокий уровень глубины и охвата.

Использование аудиозаписей Facebook: внутренние практики

В августе 2019 года издание Bloomberg News опубликовало материал о том, что Facebook заключил контракт с подрядчиками на расшифровку голосовых сообщений, переданных через приложение Facebook Messenger. Эти действия осуществлялись в рамках тестирования алгоритмов автоматической транскрипции.

Анализ аудио: автоматизация или ручная проверка?

По заявлениям компании, пользователи, чьи аудиофайлы использовались для проверки, были уведомлены о возможности участия в процессе, включая ручную проверку части записей. Тем не менее, часть публикаций подвергла сомнению прозрачность и полноту этих уведомлений, что вызвало резонанс в СМИ. Многочисленные заголовки тиражировали утверждение: Facebook признает, что прослушивает ваши личные разговоры .

Для широкой аудитории, воспринимающей информацию преимущественно через заголовки новостей, этого оказалось достаточно для возрождения дискуссий, связанных с возможным вмешательством в частную жизнь пользователей. Данный случай усилил внимание к вопросам цифровой этики и конфиденциальности.

Некоторые СМИ сопроводили обсуждение ссылками на выступление Марка Цукерберга перед Конгрессом США в апреле 2018 года. Журналисты интерпретировали его ответ на вопрос сенатора Гэри Питерса как косвенное подтверждение практики прослушивания.

Официальная позиция: Facebook отрицает сбор аудио для рекламы

В ответ на прямой вопрос о том, использует ли Facebook микрофоны устройств пользователей для сбора информации с целью персонализации рекламы, Цукерберг заявил: «Вы говорите о теории заговора, дескать мы слушаем вас и все, что происходит с вами благодаря микрофонам устройства и используем это для рекламы. Мы этого не делаем».

Компания на протяжении многих лет утверждает , что не использует микрофоны мобильных устройств для создания рекламных профилей пользователей. Впервые публичное заявление с опровержением подобных предположений было сделано в 2016 году.

Facebook не использует микрофон вашего устройства для последующего информирования вас о рекламе или для коррекции вашей ленты новостей. В некоторых недавних статьях высказывалось предположение, что мы прослушиваем разговоры людей, чтобы показывать им релевантную рекламу. Это неправда. Мы показываем рекламу на основе интересов людей и другой информации из профиля, а не того, о чем вы говорите вслух.

Несоответствие ожиданий и реальности

В ответ на рост обеспокоенности среди пользователей по поводу возможности скрытого прослушивания смартфонов, компания Wandera, специализирующаяся на мобильной безопасности, инициировала исследование для проверки гипотезы. Эксперимент был проведён в 2019 году.

Проведённый Wandera тест отличался простотой методики. В изолированном помещении разместили два смартфона — iPhone и Samsung Galaxy. Рядом с ними ежедневно на протяжении трёх дней воспроизводилась аудиозапись с рекламой корма для домашних животных по 30 минут.

[Примечание переводчика. Методика вызывает сомнения: для получения более достоверных результатов логично было бы провести эксперимент с несколькими контрольными и тестовыми группами. Например, можно было бы привлечь группы из 20–50 человек, использовать разные типы устройств и смоделировать более реалистичные условия взаимодействия с речевыми триггерами.]

Тем не менее, ниже представлены результаты оригинального эксперимента.

Признаки пассивного аудиопрослушивания

Во время тестирования пользователям предоставили максимальные разрешения на использование микрофона для ряда установленных приложений. Параллельно провели контрольный эксперимент, где устройства находились в аналогичной среде, но без воспроизведения аудиоконтента. Цель заключалась в выявлении двух возможных индикаторов прослушивания.

Во-первых, специалисты проверили, появится ли после прослушивания целевой рекламы реклама корма для животных в используемых приложениях. Во-вторых, была проведена оценка активности устройств с точки зрения потребления трафика, уровня фоновой активности и расхода заряда аккумулятора. Любые отклонения в этих параметрах могли бы косвенно указывать на передачу аудиоданных на внешние серверы.

В итоге результаты оказались нейтральными. Ни в одном из приложений не появилась реклама, связанная с кормом для животных. Также не было зафиксировано значимых отличий в параметрах устройств между аудио- и «тихим» режимами. Это указывает на отсутствие признаков фоновой передачи аудиосигналов.

Фоновая передача данных: факты и цифры

Проведённый мониторинг сетевой активности является ключевым моментом в интерпретации результатов. Если бы мобильные приложения действительно записывали аудио и отправляли его на серверы для дальнейшей обработки, это привело бы к заметному росту передачи данных.

Сравнение объема трафика, зафиксированного на устройствах с Android за 30 минут, с показателями Google Voice Assistant за тот же интервал

Мы заметили, что данные наших тестов намного скромнее, чем данные виртуального помощника за 30-минутный период времени, что говорит о том, что постоянная запись разговоров и загрузка в облако не происходит ни в одном из этих тестируемых приложений. Если бы это было так, мы бы ожидали, что картина данных будет сопоставимой с потреблением данных виртуальными помощниками.

Джеймс Мак, инженер Wandera, работающий над тестом.

Объём потребляемых данных на iOS за 30 минут по сравнению с аналогичным показателем у Siri

Отсутствие аномального трафика или другой активности, характерной для скрытого аудиозаписывающего поведения, было воспринято как весомое опровержение популярного мифа. Антонио Гарсия-Мартинес, ранее работавший менеджером по продукту в Facebook, после ухода из компании неоднократно подвергал её резкой критике.

В 2017 году Антонио Гарсия-Мартинес подготовил краткую, но содержательную публикацию для Wired , в которой аргументированно опроверг теорию о том, что Facebook осуществляет скрытую прослушку пользователей через микрофоны смартфонов. По его оценке, объём данных, требуемый для постоянного аудиоконтроля, делает такую технологию не только крайне сложной в реализации, но и практически невозможной для сокрытия.

Чтобы такая прослушка была реальной, Facebook нужно записывать все, что слышит ваш телефон, пока он включен. Функционально это эквивалентно постоянному телефонному звонку от вас к Facebook. Обычный голосовой интернет-звонок задействует передачу в 24 кбит/с в одну сторону, или около 3 кбайт данных в секунду. Предположим, что ваш телефон включен половину дня, это около 130 МБ в день на пользователя. Только в США набирается 150 миллионов активных пользователей в день, которые будут генерировать около 20 петабайт информации за 1 день и это только по США. Для сравнения, весь объем хранилища данных Facebook около 300 петабайт, а ежедневная скорость загрузки около 600 терабайт.

Из объяснения Гарсия-Мартинес в 2017 году.

Несмотря на логичность приведённых рассуждений, аргументация Гарсия-Мартинеса не учитывает возможность использования алгоритмов распознавания ключевых слов в аудиопотоке, не требующего непрерывной передачи данных в облако. В этом случае устройство могло бы обрабатывать звук локально, фильтруя важную информацию, не создавая избыточного сетевого трафика. Однако автор отверг и этот сценарий, ссылаясь на вычислительные ограничения мобильных устройств. Подобная фоновая активность потребовала бы значительных ресурсов процессора, что сделало бы её легко обнаруживаемой пользователями.

Масштаб сбора данных выходит за рамки прослушки

В начале 2017 года исследовательская группа из Северо-Восточного университета, в которую входили аспирант Цзинцзин Рен и студентка бакалавриата Эллин Пан, инициировала проект по изучению способов, с помощью которых мобильные устройства могут собирать пользовательские данные без явного уведомления. В ходе эксперимента учёные подтвердили, что скрытая активация микрофона большинством приложений не осуществляется. Однако в процессе анализа были выявлены другие, более тревожные особенности.

Невидимая активность приложений

Не было никаких утечек по звуку. Ни одно приложение не активировало микрофон. Но копнув глубже мы увидели немало странностей. Приложения автоматически делали скриншоты самих себя и отправляли скрины третьим лицам. В одном случае приложение снимало на видео активность экрана и отправляло эту информацию третьим лицам.

Кристо Уилсон, компьютерный ученый, работающий над проектом.

Исследование охватило более 17 000 Android-приложений, и выяснилось, что свыше 9 000 из них имеют встроенные разрешения, потенциально позволяющие создавать и передавать скриншоты без участия пользователя. Некоторые приложения фиксировали происходящее на экране в виде видео и передавали эти данные сторонним компаниям. Таким образом, информация с экрана устройства — это не менее ценный источник сведений, чем аудиоданные.

Подобные практики напрямую связаны с угрозами социальной инженерии, поскольку визуальные данные могут использоваться для составления поведенческого профиля пользователя и манипулирования его действиями, как указано в отдельных исследованиях .

Это намного хуже, чем если бы камера фотографировала потолок или микрофон записывал бессмысленные разговоры. Не существует простого способа закрыть эту брешь в приватности.

Дэвид Чоффнес, участник проекта.

Метаданные и не только

Несмотря на отсутствие доказательств систематической записи разговоров через микрофон смартфона, устройства продолжают активно собирать информацию о пользователях другими способами. Эти объемные массивы данных позволяют компаниям, таким как Facebook и Google, демонстрировать персонализированную рекламу, точность которой порой вызывает обеспокоенность.

Все, что делает ваш телефон полезным, например, знание того, где вы находитесь, съемка фотографий, возможность онлайн-покупок и банковских операций — это как раз те потенциальные слабости и уязвимости. Чем полезнее ваш телефон, тем он привлекательнее для рекламодателей, хакеров или тех, кто хочет получить ваши данные.

Майк Кэмпин, вице-президент по инжинирингу в Wandera.

Следовательно, источником гиперточной рекламы может быть не прямой аудиоконтроль, а гораздо более мощный инструмент — непрерывный сбор цифровых следов. Совокупность поведенческих, технических и геолокационных данных формирует крайне детальный профиль пользователя, что позволяет алгоритмам предугадывать интересы и намерения человека с высокой вероятностью.

Суровая правда

Суровая правда в том, что Facebook не нужно технически изощряться, чтобы нацеливаться на вас с помощью прослушки. Есть куда более эффективные способы сделать это. Не каждая пугающе точная реклама, которую вы видите, является чистым плодом ваших предубеждений. Помните, Facebook может найти вас на любом устройстве, на котором вы когда-либо заходили на свою страницу. Он может использовать все, что знают о вас розничные торговцы, и даже иногда отслеживать ваши покупки в магазине, оплачиваемые только наличными. Этому способствует дисконтная карта лояльности, привязка к номеру телефона или адресу электронной почты.

Из объяснения Гарсия-Мартинес

Пользователь может предположить, что его разговор о предстоящем событии стал источником показа релевантной рекламы. Однако система, обладая разнообразными каналами доступа к данным, не нуждается в аудиозаписи для формирования прогноза. Такие алгоритмы способны учитывать геолокационные метки, интересы ваших друзей, частоту и характер взаимодействия с ними.

Кроме того, технологические платформы отслеживают активность на всех устройствах пользователя, включая данные о звонках и сообщениях, зафиксированные в виде метаданных на Android-устройствах. Примером может служить сбор информации о вызовах и сообщениях , а также наблюдение за действиями, которые пользователь в итоге не завершил — например, написание, но последующее удаление текста .

Таким образом, масштабная и непрерывная агрегация данных о поведении пользователей может быть использована в рамках аналитических систем и алгоритмов машинного обучения для формирования гипотез о текущих интересах и вероятных запросах. Даже если предсказательная точность алгоритмов варьируется, обилие данных позволяет существенно повысить релевантность показов. Это делает такие системы эффективным инструментом поведенческого маркетинга с признаками глубокой персонализации.

Реальная прослушка

Устройства с функцией голосового управления действительно способны фиксировать звуковую информацию, однако только в строго ограниченные моменты. Активация происходит локально при распознавании ключевой команды, после чего краткий фрагмент аудио передаётся на серверы для обработки и получения ответа. Этот процесс технически прозрачен и может быть зафиксирован в сетевом трафике.

В то же время механизмы, использующие комплексный анализ данных, функционируют непрерывно и без явного уведомления пользователя. Они обрабатывают большое количество параметров: от перемещений до взаимодействия с контентом, с целью прогнозирования предпочтений. Логика работы таких систем зачастую непрозрачна даже для их разработчиков.

Подводя итог, можно утверждать, что идея слежки имеет под собой основания, однако объектом контроля становятся не сами разговоры, а поведенческие паттерны. Ошибочным является предположение, что рекламный контент создаётся исключительно на основе аудионаблюдения — на самом деле он опирается на анализ множества цифровых факторов. Истинная причина появления такого контента значительно глубже, сложнее для восприятия и требует понимания масштабов цифрового следа, оставляемого каждым пользователем.

Теги: сбор данных смартфонами, таргетированная реклама, поведенческий анализ, конфиденциальность данных, алгоритмы предсказания интересов

Опубликовано: 08.05.2025