Размышления Data Scientist’а о культуре, прогрессе и технологиях

А также о том, как объединить внутреннюю и внешнюю мотивацию

Моё знакомство с Data Science и Machine Learning

Солнечным весенним днём 2018 года я шёл к офису Legendary Entertainment — компании-инвестора, продюсирующей фильмы, телешоу и онлайн-медиа. Она обрела популярность после релиза «Бэтмен. Начало» ещё в 2005 году. Это был мой первый день на работе мечты в команде прикладных аналитиков.

Еще в Нью-Йоркском университете я наткнулся на исследование об основателе Legendary Entertainment, Томасе Тулле, и его попытке внедрить продвинутый анализ данных в процесс выбора идей фильмов, реализация которых может принести миллионы долларов. Я бы никогда не подумал, что однажды стану частью этого процесса. Я понимал, что все основой всех идей, которые я буду предлагать продюсерам и маркетологам компании, является результат кропотливого труда специалистов по количественному анализу, инженеров и исследователей, но мне всё равно не хватало знаний в программировании, продвинутой статистике и в генерировании особо ценных данных для компании, которая часто рисковала и полагалась только на творческую интуицию.

Мне нравилось быть частью команды, которая создавала потрясающий контент, но позже я осознал, что стою лишь на вершине айсберга. Мне было необходимо продолжать учиться. Осенью 2018 года я решил пройти онлайн-курс по data science, а несколько недель назад я ушёл из Legendary и с тех пор изучаю науку о данных в школе Flatiron в Сиэтле.

DS
Специализация Data Science
Идет набор в группу 150 000 ₽

Мотивация: внутренняя и внешняя

Я рискнул оставить хорошую работу и получить образование ради своего будущего. Положившись на свою удачу и обеспечив систему поддержки, я позволил себе не беспокоиться о неоплаченных счетах и задуматься, что мотивирует меня: как внутренне, так и внешне. Эта статья — мои размышления о мотивации, бизнесе, культуре и энтузиазме.

Я выделил четыре основных цели, которые меня мотивируют (см. схему ниже). Я осознал, что именно это двигало мной все эти годы. Даже прежде, чем я узнал, что такое наука о данных.

Проще говоря, я хочу использовать свои способности в творческих начинаниях. Я хочу оказывать положительное влияние на людей и мир. Я люблю путешествовать и хочу путешествовать. И наконец, я хочу иметь дом. Вопрос «почему» приведёт к захватывающему, но невероятно долгому разговору. А пока я попытаюсь понять, как всё это связано с реальностью и почему наука о данных поможет в достижении моих целей.

Заклятые друзья: творчество и технологии

«Каждый человек живет в двух сферах: внутренней и внешней. Внутреннее — это область духовных целей, выраженных в искусстве, литературе, морали и религии. Внешнее — тот комплекс устройств, техник, механизмов и инструментов, с помощью которых мы живем»

— Мартин Лютер Кинг — младший

Благодаря моему увлечению искусством, культурой и креативной экономикой я обращал внимание на интересные идеи, посещал интересные места и знакомился с интересными людьми. По-моему, кино, музыка, живопись, язык и другие формы самовыражения имеют более уникальное значение для истории человеческого прогресса, чем кажется на первый взгляд. Поэтому я решил использовать свои способности для расширения возможностей художников и мыслителей, которых я считаю великими. Экономика не всегда благоволит художнику, но я думаю, что технологии помогут демократизации творческой карьеры.

С появлением компаний, которые позволяют быстро поделиться своим продуктом с массовой аудиторией (YouTube, Spotify, Netflix) и получить финансирование (Etsy, Patreon, Kickstarter, Indiegogo), мир, в котором творческие способности и изобретательность напрямую связаны с финансовым благополучием, создается на наших глазах.

Новые технологии снижают затраты на производства, а удостоенные наград фильмы создаются с помощью смартфонов («Мандарин», 2015). Интернет облегчает поиск аудитории, которая готова платить за контент (Patreon). Блокчейн имеет потенциал убрать посредников маржинального обмена. Голливудские агентства по работе с талантами активно нанимают аналитиков для понимания запросов потребителей. Сегодня потребление продукта напрямую ведёт к обогащению его создателя.

Концепция «бедного художника» не будет устранена в одночасье, но сегодня всё больше людей имеют шанс начать своё дело с минимальными затратами на старте. Крупные организации будут всё больше нуждаться в новом медиа-контенте и в тех, кто его создаёт.

partfolio_ds
Специализация Аналитик Данных
Идет набор в группу 73 900 ₽

Культура и бизнес аддиктивных технологий

«Мы зациклены на лайках в Instagram и ленте Facebook; нас не оторвать от сериалов и видео на YouTube; мы работаем дольше с каждым годом и проводим в среднем три часа в день в наших смартфонах. Половина из нас предпочтёт сломанную руку сломанному телефону, а дети проводят так много времени перед экранами, что им становится трудно общаться с реальными, живыми людьми»

— «Irresistible: The Rise of Addictive Technology and the Business of Keeping Us Hooked», Адам Алтер

Являются ли финансовые обязательства и этичное поведение взаимоисключающими? Всё ли понятно с приватностью данных в сложных, наполненных юридическим жаргоном условиях соглашения об услугах Big Tech? Технический прогресс будет продолжать требовать самоконтроля, по крайней мере, пока люди задаются вопросом, как поддерживать бизнес-модель, в которой пользователи не платят за услугу.

P. S. Если вам интересен ответ — активно запускать рекламу.

Большинство устройств и приложений, которые мы используем, стремятся удержать наше внимание и, во многих случаях, заставить потратить деньги. Лидеры общественного мнения предупреждают, что мы приблизились к опасной территории. Как пользователь, я тоже веду себя довольно типично. Как будущий специалист, я считаю, что большие данные дают достаточно нерегулируемой власти организациям, ищущим прибыли. Как они собирают и используют данные и что нам об этом известно? Как сборщики данных, мы должны решить для себя, где провести ограничительную линию. В то же время я призываю не терять самосознания — как ученых, так и потребителей данных.

Наша ответственность друг за друга и за окружающий мир

«Для осуществления трансформации, в которой мы нуждаемся, необходимо признать, что каждый является участником развития… все заинтересованные стороны должны сыграть свою роль и внести свой вклад»

— Амина Джейн Мохаммед, заместитель Генерального секретаря ООН

Я всегда хотел помогать другим людям. Особенно тем, чья реальность отличается от нашей объективно благополучной жизни. Я считаю, что моя хорошая жизнь — по большей части заслуга родителей, которым удалось выбраться из маленького промышленного городка недалеко от Ливерпуля. Они усердно трудились, чтобы построить новую жизнь в Калифорнии. Мне повезло. Поэтому я считаю, что если ты можешь — ты должен как-то повлиять на окружающую реальность.

Например, ООН для меня — отличный пример работы с мировыми проблемами и использованием всех своих возможностей (особенно, если ты обладаешь навыками работы с большими данными). Нищета, голод, чистая вода и права человека — вот, что заставляет меня серьезно относиться к своей работе, которая в будущем сможет помочь в решении данных проблем. Поэтому я решил, не откладывая, заняться самообразованием. Однако желание изменить мир к лучшему легче проповедовать в блоге, чем претворять в жизнь. Как правильно расставлять приоритеты среди насущных потребностей человечества? Как правильно измерять наше воздействие? Как власти должны стимулировать вовлеченность каждого из нас?

Изменение климата: наука против власти

«Научные доказательства глобального потепления однозначны»

— Межправительственная группа экспертов по изменению климата (ООН) и НАСА

Учёные с этим утверждением согласны, политики — нет. Но факт остается фактом: температура мира увеличивается. Океаны нагреваются и становятся более кислотными. Уровень моря повышается, ледяные щиты уменьшаются, ледники тают. Экстремальные погодные явления учащаются. В конце 2018 года Конгресс США подготовил доклад о том, что именно человеческая деятельность вызывает изменение климата. Без скорого вмешательства мы нанесем непоправимый ущерб нашей планете. Человечество должно действовать быстро. И наука о данных может помочь — поэтому я продолжу учиться.

Исследования помогают понять наше место на Земле. Наука — самый убедительный источник информации. Но даже сегодня ученых обвиняют в некомпетентности и обмане. Насколько опасны политические действия, оторванные от науки? Когда научные открытия становятся фактами, и почему стало так легко отрицать науку? Как поднять доверие населения и властей к науке? Как большие данные могут помочь? У меня больше вопросов, чем ответов.

Идеализм миллениалов, кредит на обучение и своё жильё

Признаюсь, как и многие миллениалы, я хочу, чтобы работа соответствовала моим ценностям и стремлениям. Но несмотря на желание сделать мир лучше, многие из моих целей завязаны на материальном. Я хочу хорошо зарабатывать, чтобы потом тратить деньги на путешествия и на недвижимость. Я пишу эту статью на MacBook, попивая кофе за 200 рублей. Я не служил в армии и не участвовал в боевых действиях. Я вырос в уютном доме в благополучном районе. Родители позаботились, чтобы у меня было всё, что я пожелаю. У меня была привилегия мечтать и иногда терпеть неудачи. Но быть идеалистом обычно невыгодно, хотя одно другого не исключает: я в равной степени амбициозен, удачлив и умею быть благодарным.

Но несмотря на это, у меня всё равно есть долги. Я знаю немного людей до 30, которым удаётся выплачивать кредит за учёбу и откладывать на дом: они многим пожертвовали, чтобы сразу после колледжа получить хорошую работу на Уолл Стрит, и уже много лет работают по 80 часов в неделю. Покупка недвижимости — это не то, к чему стремятся мои сверстники до того, как их волосы поседеют.

Я большой сторонник онлайн-курсов и дипломов (например, EdX), bootcamp-тренировок (уже упомянутая Flatiron School) и программ поощрения преподавателей. Разнообразие и инклюзивность предметов должны оставаться центральным элементом прогресса в области образования. Самое важное заключается в том, что преподавателям и учащимся необходимо уделять первостепенное внимание, а не использовать их в стремлении к инновациям в сфере образования.

Последняя причина, по которой я решил изучать науку о данных, — спрос, который в настоящее время превышает предложение. Возможность стать незаменимой частью быстрорастущей компании поможет мне закрыть студенческий долг, накопить на путешествия и рано или поздно купить дом. Те, кто тонет в студенческих долгах, — какова ваша стратегия освобождения? Учителя и студенты — какие тенденции в образовании дают вам надежду? Те, кто закрыл студенческий долг, — какие стратегии сработали для вас? Чем вы пожертвовали в процессе?

Наука о данных: мультитул для всеядного

Существует не так много профессий, которые могут удовлетворить мой, кажется, бесконечный список интересов. Помимо технических навыков, у лучших дата-сайентистов есть качества, которые позволяют запускать интересные проекты в самых разных областях.

Дата-сайентист должен задавать правильные вопросы. Что нужно знать компании, чтобы быть уверенной в своей стратегии, понимать своих клиентов, оптимизировать затраты и процессы, находить новые возможности? В исследователе данных должны сочетаться технические навыки и опыт работы в конкретной области, он должен уметь извлечь реальную ценность из необработанных данных.

Дата-сайентист должен быть увлечён своим делом. Чтобы найти лучшие решения, нужна решительность — и гораздо приятнее, когда энергия для работы появляется от внутренней мотивации, а не от чашки кофе. Без чёткого руководства и доли здравого перфекционизма дата-сайентист не всегда может найти оптимальное решение. Однако это не мешает успешному исследователю данных понять, когда пора перестать анализировать и начать внедрять идеи, составлять рекомендации, разрабатывать решения проблем и побуждать к действию.

Дата-сайентист должен быть любопытным. К каждой проблеме существует множество уникальных подходов, и хорошему исследователю данных следует рассматривать альтернативы. Я постоянно спрашиваю себя, есть ли более эффективные способы получения, очистки и слияния данных, чем метод, который я сейчас использую. Это требует времени и творчества. Также хороший специалист по данным должен быть в курсе последних новостей и достижений в области технологий.

Важно признать, что не каждая проблема может быть решена с помощью данных — иногда нужно оставлять выбор на совести человека. Данные должны использоваться для принятия решения и улучшения прогноза, но не всегда их нужно считать истиной в последней инстанции. Случаются ошибки, ведь прогнозирование — это не только наука, но и искусство. Модели устаревают, бизнес-среда меняется. Иногда на прогнозы влияют предвзятость, погрешность или «неустранимая ошибка» — самое неприятное явление для дата-комьюнити. Уверенность в правильности прогноза никогда не достигнет 100% — никто не может знать будущее наверняка. Мы можем только чуть точнее представить неизвестное, выжав максимум информации из известного.

х: Неизвестное

Гораздо больше сил, чем стремление к новым знаниям, мне придаёт осознание того, что не знаю я гораздо больше. Я учусь принимать эту истину в бизнесе, в жизни и двигаться вперед, несмотря ни на что. Я не знаю, сформируют ли мои мечты, планы и навыки идеальное сочетание науки о данных, удовольствия, успешности и самореализации. Но я точно знаю, что никогда не буду жалеть, что пошёл на этот просчитанный, ориентированный на образование риск, который вывел меня за пределы зоны комфорта. Именно вне зоны комфорта я получил самый впечатляющий опыт. Чем больше я узнаю, тем больше понимаю, как много еще предстоит открыть. Так давайте учиться и совершенствоваться вместе.

Оригинал статьи: A New Data Scientist’s Reflections on Culture, Progress, & Technology

перевод: Астафьева Наталья

Поделиться: