8 причин стать дата-сайентистом в 2022 году

8-reasons-data-science-cover-2
И как получилось, что сейчас без них не обходится ни одна отрасль экономики

Данных становится все больше. Чтобы они не просто копились, а приносили пользу, их нужно анализировать. Для этого нужен дата-сайентист — специалист, который на основе данных строит прогнозы. В бизнесе он помогает больше зарабатывать, а в научной среде — точнее проверять сложные гипотезы. Почему же работа дата-сайентиста важная, интересная и перспективная, несмотря на кризис? Разбираемся с Владимиром Васильевым, тимлидом направления Data Science в Сбере.

Data Science помогает сделать жизнь комфортнее и разнообразнее

Искусственный интеллект и алгоритмы машинного обучения, которыми занимаются в Data Science, развиваются стремительно. Мы живем в обществе потребления: нам интересно пробовать что-то новое, удобное, что-то, что доставляет нам комфорт. Мы готовы тратить больше денег на новые сервисы, продукты, услуги, лишь бы они облегчали нам жизнь. Спрос растет, закономерно возникают новые бизнес-модели, для которых нужны искусственный интеллект, прогнозы, эксперименты. И здесь не обойтись без дата-сайентиста.

Тут есть еще два фактора. Во-первых, цифровизация породила большое количество данных. За счет распространения смартфонов с мгновенным доступом в интернет мы стали чаще пользоваться сайтами и логировать (записывать все действия, производимые на устройстве, в приложении, программе) буквально всё. Многие бизнесы отреагировали на это и переехали в сеть. Дальше по спирали: данных становится еще больше, а их можно и нужно анализировать.

Во-вторых, Data Science стала быстрее развиваться благодаря мощностям современных компьютеров. Еще пару десятков лет назад это были основательные вычислительные машины. Сейчас они и уменьшились в размерах, и стали мощнее, доступнее, мы даже можем их приобрести и строить сложные модели дома на удаленке. Вот так алгоритмы, которые на самом деле давно существовали, стали массовым явлением и вошли в промышленную эксплуатацию.

Наука о данных нужна буквально везде

Технологии искусственного интеллекта стали настолько популярными еще и потому, что они применимы почти во всех областях.

Например, в нефтегазовой отрасли можно прогнозировать срок поломки трубопровода. Дата-сайентист может предсказать, когда эта поломка произойдет, обследовать качество трубопровода, отслеживать качество поступающей нефти, используя временные ряды. Это сэкономит компании миллионы долларов.

У той же нефтегазовой компании есть бизнес — заправки. Здесь дата-сайентист спрогнозирует поток клиентов, спрос как на бензин, так и на сопутствующие товары в конкретной локации. Это поможет не только сэкономить, но и увеличить прибыль.

Рядом с ритейлом тесно стоят логистические и транспортные компании. Здесь можно предсказывать поступление товаров в аптеки, магазины, офисы банка, в пункты доставки, анализировать, сколько, каких и в каком объеме нужно товаров.

Другие яркие примеры искусственного интеллекта — голосовые помощники, которые могут включить музыку, забронировать билет, поставить напоминание, разбудить или рассказать о новостях.

Бизнес может применить любое предсказание: от прогноза погоды до котировок на фондовом рынке или на рынке криптовалюты. Фантазировать можно долго.

И вот важная особенность: многие алгоритмы — типовые, потому что базируются на основных типах решаемых задач — в области хоть текстов, хоть речи, хоть цифр. Это и делает работу дата-сайентиста универсальной и масштабируемой на многие отрасли.

Дата-сайентисты знают, как использовать даже самые неожиданные эксперименты

В программировании, чтобы получить лучший результат, задачи нужно решать определенным образом, точно знать, какой инструмент уместнее применить. Поэтому там есть много фреймворков, которые можно использовать повторно. Существует много кодовой базы, и с большой вероятностью можно считать, что задачу уже кто-то реализовывал.

Задачи же дата-сайентиста, как правило, нетривиальны, и никто, часто даже сам дата-сайентист, приступая к ним, может до конца не знать, как их решить. При этом он полагается на машину, которая сделает за него большую часть работы и поможет принять наиболее эффективное решение.

Читайте статью о Big Data: что это и где применяется?

Большая часть работы — это абсолютное творчество с непредсказуемым результатом. Даже самый неожиданный эксперимент может принести плоды, от которых дата-сайентист в своей работе тут же увидит отдачу: как прогноз повлияет на бизнес-процесс, как после этого улучшится жизнь пользователей. Это позволяет ему понимать и предвосхищать ожидания и задачи бизнеса.

Дата-сайентисты меняют жизнь

Например, в здравоохранении благодаря машинному обучению можно диагностировать патологии. А в финансах алгоритмы помогают банкам принимать решения о выдаче кредитов. Онлайн-переводчики, голосовые помощники, персонализированная лента в соцсетях и стримингах — все это стало возможно благодаря Data Science, и все это здесь и сейчас меняет мир к лучшему и упрощает нашу жизнь.

Всегда найдутся задачи и для трудоголиков, и для умеренных работяг

В каждой компании задачи дата-сайентиста могут отличаться, уровень ответственности везде разный. В крупных компаниях на каждую задачу найдется свой специалист: дата-инженер, дата-аналитик, бизнес-аналитик. Поэтому дата-сайентист может рассчитывать на то, что не будет выполнять чужие обязанности. Ему ставят задачу, приносят данные, а дата-сайентисту нужно только подбирать гиперпараметры, искать оптимальную модель, обучать ее, получать метрики и отдавать бизнесу.

В стартапах на дата-сайентиста могут полагаться уже при формировании гипотезы. Ему нужно будет собрать данные, исследовать их, предобработать, убрать пропуски, повторы, построить релевантную репрезентативную модель, которая будет подтверждать или опровергать гипотезу. Чтобы модель действительно стала работающим продуктом, который будет полезен бизнесу, она должна встраиваться в другие сервисы. Поэтому от дата-сайентиста также могут ожидать, что он упакует модель в контейнер, который можно встроить в сервис. Да, дел много. Но все это поможет отлично прокачать жесткие навыки, а с этим можно либо претендовать на повышение, либо выходить на рынок и смотреть вакансии с окладом выше.

Возможности для быстрого карьерного роста

Этот пункт вытекает из предыдущего. С отработанными хард-скиллами дата-сайентисту проще определить свою стоимость, чтобы развиваться вертикально. Если он дорос до мидла, ему ничего не мешает найти другое место. И частая смена компаний в сфере — это скорее норма, потому что рынок растет быстрее, чем зарплата в отдельной компании.

А если дата-сайентист сосредоточится еще и на софт-скиллах, то сможет стать лидером команды, тимлидом или занять другую управленческую должность. Такой сотрудник ценится не только как технический специалист, но и как эксперт, который соединяет бизнес и исполнителя. А за это дата-сайентист имеет все основания просить больше денег.

Дата-сайентистам готовы платить много. Очень много!

Хоть и найти полную статистику по зарплатам невозможно, есть зарплатные ориентиры, которые показывают, что дата-сайентистам хорошо платят. По данным зарплатного калькулятора Хабра, средняя зарплата дата-сайентистов — 164 тыс. рублей.

На hh.ru в августе 2022 года оклады начинаются от 130 тыс. и доходят до 400 тыс. рублей. При этом в вакансиях все реже встречаются примерные вилки, работодатели готовы обсуждать зарплатные ожидания с кандидатами.

В условиях повышенного спроса и даже скорее невысокого предложения дата-сайентистов им готовы переплачивать. Но нужно понимать, что все познается в сравнении. На старте в Data Science можно получить оклад выше, чем в разработке, потому что разработчиков в целом больше. Спрос на дата-сайентистов устойчиво сильный. Даже у меня в команде он высокий, я месяцами не могу найти специалистов.

Там, где их востребованность доказана, спрос не снизится даже в кризис

Часто Data Science нацелена не на профильную деятельность компании, а на новые рынки, бизнес-модели, эксперименты. И когда мы входим в тяжелейшую рецессию и спад экономики, закономерно, что бизнес сменит фокус с непрофильных активностей на основные задачи. И как бы ни была компания заинтересована в искусственном интеллекте, ей придется поставить эксперименты на паузу и скорректировать бюджеты.

Но при этом важно понимать, что востребованность дата-сайентистов там, где она уже доказана, никуда не уйдет. Быстрее всего удастся вырасти в отраслях, которые располагают самым большим количеством данных. Это телеком и финтех. Сейчас рынок устроен так, что у компаний-гигантов монополия на данные. В мире это Amazon, Netflix, Google, Microsoft, а в России — Яндекс, Сбер, МТС, VK, Тинькофф, Альфа-Банк, ВТБ. Среди дата-сайентистов такие компании в фаворе, потому что они готовы создавать новое, находить инсайды и строить алгоритмы.

Освойте новую профессию

(рейтинг: 5, голосов: 2)
Добавить комментарий