Битва за данные

I605_lid_image146773

Каждый наш шаг оставляет цифровой след: когда мы гуглим значение нового мема, покупаем кофе в Старбаксе, слушаем музыку в Apple Music, лайкаем фотку соседского кота, кликаем виральный заголовок, смотрим новую серию «Игры престолов». И чем больше у нас гаджетов, тем больше данных о нас собирают. Компании пытаются узнать нас поближе, чтобы продать нам больше товаров и услуг. Иногда они знают о нас больше, чем мы знаем о себе.

Афоризм «данные — это новая нефть» (англ. data is the new oil) успел набить оскомину. Но и в гениальности ему не откажешь: он помогает нам выпендриваться на технологических конференциях вот уже 10 лет. Авторство цитаты приписывается британскому математику Клайву Хамби, разработавшему систему лояльности для торговой сети Tesco. Он произнес ее на конференции по маркетингу в 2006 году. Постепенно смысл этих слов доходит до широкой аудитории. И хотя люди продолжают воевать за нефть, контуры будущих конфликтов за данные проступают уже сейчас.

До недавних пор компании управляли традиционными активами — имуществом, деньгами, интеллектуальной собственностью. Цифровая эпоха принесла новый тип активов — данные. Это сырье, из которого производятся прогнозы, инсайты и очень большие деньги. Как пишет Economist, в XXI веке данные сыграют ту же роль, что нефть в XX-м. То есть станут главным фактором роста и перемен. Онлайн-сервисы работают на данных, как машины на бензине.

Объем накопленных миром данных в зеттабайтах

Исследование IDC, апрель 2017

Благодаря интернету вещей источниками данных стали любые устройства — от тостера до авиационного двигателя. Цифровой слепок человека все точнее. Все, что мы делаем, генерирует данные, а данные генерируют кэш. По прогнозу IDC, в 2017 году мировой рынок больших данных заработает $150,8 млрд, в 2020 году — $203 млрд.

Чем больше гуглишь, тем больше Google

Сначала интернет-компании использовали собранные данные для таргетинга рекламы. С расцветом технологий искусственного интеллекта стало ясно, что данные можно превратить в AI-сервисы, которые станут новым источником прибыли.

Многочисленные ИИ-стартапы создают умные сервисы на все случаи жизни: от анализа рентгеновских снимков до точного земледелия (подсказывают фермеру, на какие участки поля распылять гербициды). Пороги входа на рынок ИИ снижаются: растут вычислительные мощности, дешевеют датчики и железо, мощные инструменты для машинного обучения (TensorFlow от Google, DMTK от Microsoft, CatBoost от «Яндекса») открыты для любого программиста.

Главным конкурентным преимуществом на рынке искусственного интеллекта становятся сами данные. И вот ими-то, в отличие от софта, корпорации делиться не спешат. Аналитики IBM характеризуют состояние рынка данных как олигополию, где крупные игроки контролируют большую часть пирога. В интернете находится только 20% данных, остальные 80% хранятся в недрах компаний и организаций. Поэтому топ-менеджер IBM Дэвид Кенни считает данные валютой будущего.

Магия данных в том, что они помогают усовершенствовать продукт и привлечь больше пользователей, которые нагенерят еще больше данных, которые позволят привлечь еще больше пользователей. Данные — топливо современного рекламного рынка. Мировые ИТ-гиганты рвутся со своим бесплатным интернетом в страны третьего мира, чтобы заработать на данных офлайнового населения. Правда, на конференциях это принято называть устранением цифрового неравенства и желанием сделать мир лучше.

Лидерство Google, Facebook, Microsoft и Amazon в искусственном интеллекте во многом объясняется тем, что они владеют огромным количеством данных, которые нужны для обучения умных алгоритмов. Если вы тоже хотите заработать на ИИ, вам придется либо собрать, либо купить данные, которые по мере развития ИИ будут только дорожать. Известный на Западе техноскептик Евгений Морозов считает, что технологические титаны приватизируют наши данные, а это сулит нам новый феодализм.

Какими данными о человеке располагают крупнейшие в США брокеры данных

Исследование «Corporate Surveillance in Everyday Life», июнь 2017

Data-driven сделки

В экономике данных уже так не важно, окупается ли ИТ-проект. Когда есть большая аудитория и налажен сбор данных, монетизация — дело наживное. В этом свете 68-миллиардная оценка убыточного Uber, который многие считают пузырем, уже не кажется полным абсурдом. Самый дорогой стартап мира владеет крупнейшим массивом данных о рынке персональных перевозок (более 5 млрд поездок). Равно как и Tesla — не просто модный электрокар, а база данных о вождении на совокупной дистанции более 2 млрд км. Она дает компании фору в создании технологии беспилотного вождения. У разработчика беспилотных авто Waymo (принадлежит Alphabet) пока на порядок меньше данных.

Самым ценным активом обанкротившейся гемблинговой компании Caesars Entertainment оказались данные о 45 миллионах участников программы лояльности. Их оценили в $1 млрд.

Корпорации могут позволить себе купить компании, которые владеют нужной им базой пользователей. Этим объясняются многие крупнейшие сделки последних лет. Facebook купил Instagram и WhatsApp, Microsoft купил LinkedIn и т.д. Это вызывает беспокойство антимонопольных властей. В процессе согласования сделки по поглощению WhatsApp Facebook обещал не объединять данные двух компаний, но в прошлом году таки начал это делать. За это Еврокомиссия оштрафовала соцсеть на $122 млн.

Экономика данных требует от регуляторов новых подходов. Им придется быть не менее изобретательными, чем те, кого они регулируют. Чтобы не допустить диктата монополий, власти обязывают крупняк делиться данными с новыми проектами. Например, в Германии страховщики должны делиться с маленькими фирмами статистикой о страховых случаях. В следующем году вступят в силу европейские нормативы о защите данных. Интернет-сервисы будут обязаны получать от пользователей явное согласие на то, как будут использоваться их данные, а также позволить им экспортировать свои данные для передачи другим компаниям.

Чтобы конкурировать с гигантами, более мелкие игроки могут собираться в data-кооперативы. Так, крупнейшие немецкие медиа объединили большие данные с тысячи своих сайтов на общей платформе Emetriq, чтобы снизить свою зависимость от Google и Facebook, контролирующих 85% мирового рекламного рынка.

Легально торговать данными гораздо труднее, чем нефтью. Каждый датасет уникален, такой актив сложно оценить. Правовой базы еще нет, каждый контракт сочиняется с нуля и содержит десятки страниц о том, как покупатель будет использовать и защищать данные. Oracle разрабатывает единую инфраструктуру для обмена данными, которая позволит ее клиентам покупать и продавать свои базы данных в безопасной облачной среде.

Есть интересные примеры бартера: Национальная служба здравоохранения Великобритании предоставила DeepMind (ИИ-подразделение Alphabet) доступ обезличенным данным 1,6 млн пациентов, чтобы умные алгоритмы помогали врачам лечить пациентов с почечной недостаточностью.