4 аспекта использования больших данных, о которых следует помнить [Обзор Платформы по защите детей]

details

Дата публикации:  01/05/2018 издатель:  Платформа по защите детей Тип публикации:  Информационный лист

Конфиденциальность и права детей

Основная критика в отношении использования больших данных и их анализа в связи с этой темой связана с проблемой конфиденциальности. Большая часть данных создается пассивным образом как побочный продукт при просмотре веб-страниц, соцсетей или в результате других действий в интернете. Поэтому люди могут не знать о том, что частные компании хранят административные данные, историю покупок, поисковые запросы и данные о местоположении в своих хранилищах. Проблема с такой информацией заключается в том, что к ней легко могут получить доступ не те люди, что нарушает наше право на конфиденциальность и личную свободу. Что касается детей, еще более важно, чтобы власти гарантировали защиту подобных данных, вводя проверку политики и поощряя прозрачность того, как происходит процесс сбора, хранения и анализа больших данных в технологических компаниях. И хотя большие данные предлагают множество новых подходов и преимуществ в области защиты детей, необходимо помнить о том, что данные, собранные у детей, должны быть защищены и обезличены с учетом права на конфиденциальность. В документе, подготовленном ООН, высказываются опасения относительно неопределенности будущего использования больших данных, их продажи для исследований рынка и отсутствия контроля над цифровыми личными данными в качестве основных вопросов этики данных и прав детей. Рекомендуется обеспечить детям и подросткам возможность высказывать свое мнение по этим вопросам, а также гарантировать их равное участие в обсуждениях права на конфиденциальность и совместного использования данных. Одним из шагов, направленных на защиту данных и права детей, стали новые правила передачи данных, принятые ЕС, которые требуют согласия родителей на сбор и дальнейшее использование компаниями данных детей в возрасте до 16 лет (этот порог может быть снижен до 13 лет в отдельных странах-участницах). Однако даже при наличии подобного постановления важно, чтобы компании демонстрировали более жесткий контроль над сторонними организация при продаже необработанных данных. Кроме того, в первую очередь, сами дети и родители должны знать о существовании таких данных. 
 

Отсутствие контекста 

Данные, собранные из онлайн-источников, часто вырваны из контекста и рассматриваются как простой текст для аналитических целей, который несет с собой как риски, так и проблемы. Во-первых, без контекста, в котором этот текст был написан, трудно раскрыть истинный смысл слов или то, что человек действительно хотел сказать. Например, может быть трудно отделить представления от фактов, что наилучшим образом было продемонстрировано в исследовании Google Flu. Направленный изначально на прогнозирование активности гриппа, сервис ошибочно подбирал тексты, которые описывают те же симптомы, но на самом деле связаны с обычной простудой. Неверно прогнозированные данные о распространении гриппа могли отразиться на принятии врачами решений о диагнозе или при создании запасов медикаментов. Диалекты и сленг также могут создавать трудности для анализа текстов. Кроме того, часто бывает сложно проверить достоверность онлайн-информации и отличить реальное мнение или факты от ложной информации. Во-вторых, вырывание данных из первоначального контекста может привести к дискриминации по признаку сексуальной ориентации, состояния здоровья или других личных вопросов. Аналогичным образом, компании или власти могут использовать данные, полученные через социальные сети и Интернет, для отнесения отдельных людей в группы высокого риска и удаления их с платформы, таким образом, проводя дискриминацию на основе их поведения в Интернете. 
 

Данные и предубеждения

Большая часть критики в отношении алгоритмов, прогнозирующих будущие результаты на основе выявленных факторов риска, например, домашнего насилия или злоупотребления психоактивными веществами, звучит вокруг потенциальных предубеждений. Критики утверждают, что компьютерный анализ может чаще реагировать на общины меньшинств, поскольку в среднем там, как правило, присутствует большинство выявленных факторов риска. Используя алгоритмы аналитики, выявляющей факторы риска на основе карт или местоположения, система может выбрать больше неблагоприятных областей, что может привести к ненужному вмешательству или изъятию детей. Поэтому важно объединять систематический анализ с оценкой кейсов социальными работниками. Один из экспертов, комментируя инструмент скрининга семьи в Пенсильвании, подчеркнул важность прозрачности прогнозов, основанных на данных, а также то, что целью систем должно быть сведение к минимуму существующих предубеждений путем систематического анализа информации.

Неодинаковая доступность цифровых технологий

Хотя в последнее время использование больших данных и анализа данных в целом росло в большинстве регионов мира, до сих пор существуют большие области (чаще всего – в развивающихся странах), где у людей нет собственного мобильного телефона и доступа в Интернет. Поэтому важно учитывать, что данные, собранные подобным образом, во многих случаях не могут быть репрезентативными для всего населения. Хотя исследования с использованием больших данных имеют много преимуществ, особенно в сочетании с целями развития, необходимо убедиться в том, что исследования и политики не исключают сегменты населения и их соответствующие потребности.
 

Для получения дополнительной информации и полезных ресурсов, пожалуйста, загрузите документ ниже.

Общее количество страниц: 
2
Страна (страны), которых касается этот материал: 
Международный

Этот проект финансируется: