Как большие данные изменили мир?

Большие данные сделали мир более предсказуемым, но эта предсказуемость пока доступна не всем. Рассказываем, как общество стремилось к открытости и что необходимо современному человеку.

Предсказуемость поведения других людей или сообществ — заветная мечта любого руководителя и способ хоть упорядочить мир вокруг себя любого человека. Попытки заглянуть в будущее, чтобы понять, как лучше действовать, известны нам с начала письменной истории. Аргонавты шли за предсказаниями к Додонскому дубу, царь Спарты Леонид — к жрецам-эфорам, римские легионеры бросали зерно священным курам, чтобы понять, что их ждет в битве. Даже в Средние века под угрозой костров инквизиции благородные нобили и простые горожане обращались к различного рода астрологам и колдунам за информацией о будущем.

Однако был и параллельный тренд: находились смутьяны, которые утверждали, что не все происходящее — в руках богов. И если изучать природу и людей, можно предсказывать будущее лучше эфоров и астрологов. Начал смуту античный натурфилософ Фалес Милетский (VI век до н.э.). Он спрогнозировал хороший урожай оливок и, говоря современным языком, инвестировал средства в эту отрасль, неплохо заработав. С этого момента люди начали понимать практическую ценность данных — если правильно собрать и проанализировать их, появляется предсказательная сила, и можно понять, как в будущем себя поведут природные или социальные явления. 

Все врут

К концу XIX века c предсказуемостью природы более или менее разобрались, а вот предсказуемость человека оставалась проблемой. Молодая наука социология заявила, что эта проблема — решаема. Ведь человека можно просто спросить, что он думает по тому или иному поводу. Искомые данные  — совокупность таких мнений.

Однако со временем и здесь проявились трудности. Во-первых, это довольно дорогое удовольствие: опросить большие пласты населения могли себе позволить только крупные компании и госструктуры. Во-вторых, опросы работали только там, где это общественное мнение было и где его могли свободно выражать. И, в-третьих, общественным мнением научились манипулировать, а сами респонденты стали скрывать свое истинное отношение по щекотливым вопросам (румынскому диктатору Николаю Чаушеску, например, за несколько месяцев до его казни отрапортовали о том, что рейтинг его одобрения — 89%).

Нужен был новый подход к сбору данных. Влиятельный социолог Ирвинг Гофман в своих работах «Представление себя другим» и «Поведение в публичных местах» говорил, что в коммуникации всегда важнее и ценнее не та информация, которую собеседник говорит о себе сам, а та информация, которую он выдает о себе ненамеренно. Например, человек сколько угодно может говорить о своем хорошем образовании, но слово «лОжит» выдаст его с головой. Но как собрать такую информацию, чтобы ее было достаточно, а люди не замечали, что эту информацию о них собирают?

Мир Big data

Цифровая революция дала такую возможность. Появились социальные сети, компьютерные и мобильные игры, возможность мгновенной коммуникации. Заходя в Facebook, вбивая поисковые запросы, мы оставляем цифровые следы, которые компании стали складировать, анализировать и продавать. Большие данные о нашем поведении, сначала в сети, а затем и в обычной жизни, стали новой нефтью. 

Что скрывается за термином «Big data»:

  1. сами массивы слабоструктурированных данных;
  2. математические методы их анализа; 
  3. те неявные закономерности, которые выявляются в результате анализа этих данных и могут быть использованы в качестве обоснования тех или иных решений. 

Частично эти данные мы отдаем сами, выкладывая свои фотографии, делясь любимыми ресторанами, книгами и фильмами, вузами и школами, или, например, отвечая на дурацкие тесты, которые собирают адреса электронной почты. Но также эти данные собираются без нашего ведома, например, когда GPS-навигатор в смартфонах сохраняет наше местоположение. 

Большие данные открыли массу возможностей: они помогают предсказывать успехи бейсболистов и пробки на городских дорогах, эффективность работы сотрудников, платежеспособность клиентов, урожайность угодий. Big data теперь основной инструмент заработка на предсказуемости для компаний, а также контроля – для государственных органов. 

Ради вашей безопасности

Уже сейчас банки отслеживают клиентов в социальных сетях и решают, давать ли кредит на основе их цифровой истории, а страховые компании могут повышать стоимость страховых выплат исходя из того, сколько шоколада или алкоголя в месяц вы покупаете.

 

Большим скандалом обернулась попытка американского Агентства национальной безопасности разработать на основе big data алгоритм Skynet, который искал экстремистов. В презентации утверждалось, что алгоритм использует более 80 различных характеристик для определения «террористичности» объектов слежки. Обработка данных дала неожиданный результат — наиболее подозрительным оказался журналист Ахмад Зейдан (Ahmad Zaidan), руководитель бюро Al-Jazeera в Исламабаде. Просто журналист вел подходящий по характеристикам образ жизни — часто менял телефонные номера, передвигался по опасным маршрутам, общался с сомнительными людьми. 

Правительство Китая активно собирает огромное количество данных, на основании которых каждый гражданин получает определенный социальный рейтинг. Тем, у кого низкий рейтинг, могут запретить работать в госучреждениях, летать на самолетах, работать в пищевой и фармацевтической промышленности. Фурор вызвали материалы о положении уйгуров, этнического меньшинства, преимущественно, исповедующего ислам. Для этого народа выстроили дивный новый мир, антиутопию со сбором ДНК-материалов, слежкой 24/7, контролем того, что люди читают и смотрят. 

Как жить в цифровой реальности? 

Получается, что большие данные, как это часто бывает с новыми технологиями, решив одни проблемы с предсказуемостью и безопасностью, создала нам новые. 

Да, теперь, благодаря повсеместному внедрению использования больших данных мы уже внимательнее можем следить за своим здоровьем, рационально использовать продукты и электроэнергию и безопаснее ездить. Даже обычный счет шагов и контроль пульса в фитнес-браслете делает важное дело – считывает данные о работе сердца, а сердечно-сосудистые заболевания — главная причина смертности во всем мире. Большие данные дают возможность лечить диабет, как это делает израильский стартап GlucoMe, или находить доноров костного мозга, как это делает отечественный Русфонд

Но цифровое неравенство — серьезная проблема. Государство и большие компании знают о нас всё (ну или слишком многое), а вот мы о них и о процессах сбора на нас досье — не очень. Но эту проблему можно решить при помощи осознанного цифрового поведения и усиленного самообразования. В идеале — хотя бы на базовом уровне научиться оперировать большими данными, понимать, откуда они берутся и кем используются, а также делать выводы на их основе. 

Текст: Илья Стахеев

Поделиться:
Опубликовано в рубрике UncategorizedTagged

SkillFactory.Рассылка