way_to_DS

DATA SCIENTIST: Кратчайший путь к новой профессии

Кто может нырнуть в “озеро данных” и поднять на поверхность бесценные аналитические сокровища? Кто предсказывает ураган по дуновению ветерка и водит дружбу с “электронными мозгами”? Кто обеспечивает развитие умных IT-сервисов и отмахивается от недоброжелателей веерами купюр? Разумеется, всё это про дата-сайентистов.

Эта профессия объединяет искусственный интеллект и большие данные, умение заглянуть за горизонт, не теряя при этом связь с реальностью. В погоне за модой и солидными окладами тысячи IT-специалистов примеряют на себя это поприще, ошибочно полагая, что дата-сайентист немногим отличается от продвинутого аналитика. Сегодня мы расскажем, почему это не так и как избежать самых частых ошибок на пути к мастерству.

Разберёмся с терминами

Помните поговорку про чёрную кошку в тёмной комнате? В общем и целом, она отлично передаёт суть профессии Data Scientist. Главная задача такого специалиста — это сделать правильный выбор из десяти комнат, чтобы там действительно оказалась кошка. Оказавшись внутри, он ощупывает стены и пишет скрипт для робота, который и хватает искомое животное.

Если отбросить метафоры, Data Scientist превращает сырые данные в материал, с которым можно работать. В отличие от традиционного аналитика, который тоже занимается комплексными моделями и автоматизированными скриптами, специалист по Data Science, как правило, не ищет ответы на поступающие вопросы, а сам их формулирует и строит прогнозы на будущее. Некоторые задачи требуют от эксперта плотной работы с “электронными мозгами”, которые он фактически учит думать: закладывает алгоритмы получения информации и принятия решений таким образом, чтобы аналитическая модель дальше выдавала полезный результат без участия человека. Как бы то ни было, усидчивость и внимательность к деталям имеют для Data Scientist чуть не большее значение, чем для других программистов и разработчиков. При этом в такой работе все равно остается много практики, экспериментов и творчества.

Data Science в первом приближении

Одни дата-сайентисты предоставляют данные для своего руководства, коллег из соседних департаментов, сторонних заказчиков, другие концентрируются на машинном обучении, создают сложные алгоритмы и аналитические модели. К первым приходят, чтобы узнать, почему менеджеры по продажам не справляются с планом, какой из компонентов нового лекарства вызовет меньше побочных эффектов, где интернет-магазин теряет потенциальных покупателей. Вторые работают над автоматическими системами рекомендаций и онлайн-помощниками, логистическими программами и продвинутым промышленным оборудованием.

Знаменитый закон Парето гласит, что при выполнении задачи 80% потраченного времени дают 20% результата. Так и у дата-сайентистов — чтобы получить ответы на свои вопросы, проверить гипотезу или сделать прогноз, им приходится найти источники корректных данных, отсеять мусор, отработать возможные искажения. Ошибка на этом этапе может обнулить итоговые результаты, после чего эксперту приходится начинать заново.

Что нужно уметь

В 2018 году журнал Harvard Business Review попросил 35 дата-сайентистов рассказать, какие навыки они считают самыми важными для успешного специалиста в своей области. Если вы думаете, что эксперты говорили про знакомство с десятками аналитических программ и сотнями приёмов machine learning, то вы ошибаетесь. В наши дни нелегко угнаться за новыми технологиями, которые появляются чуть не каждый месяц. Участники опроса полагают, что гораздо важнее уметь постоянно учиться, общаться с коллегами и получать от них нужную информацию.

Возможно, поэтому из всех областей IT именно Data Science сейчас проявляет наибольший спрос на специалистов начального уровня. Чтобы подняться к вершинам, вам нужно будет не только близко познакомиться Python и его библиотеками, но и применить свои познания в математике и статистике, научиться работать с нейросетями и моделями машинного обучения, Big Data и системами распределенных данных. И самое главное, эти знания нужно «подружить» с бизнес-реалиями, потому что каждый дата-сайентист хорош настолько, насколько его работа помогает с реальными задачами компании.

Читайте в блоге: Как успешно пройти собеседование на должность Data Scientist? Самый полный гид

Потому и образование у такого специалиста должно быть комплексным: набрать теоретический багаж и максимально отработать его на практике; сосредоточить усилия на технологиях, которые отвечают ожиданиям сегодняшних работодателей; научиться работать в команде, собирать обратную связь от коллег и понимать, что от тебя как специалиста ждут по итогам проекта. На этих принципах построен курс SkillFactory по Data Science.

Не просто обучение

  1. Сила команды. Студентам SkillFactory помогает не сдаться раньше времени сильное сообщество менторов и наставников из крупных российских и международных компаний. Это не просто преподаватели — они следят за прогрессом учеников, мотивируют их, отвечают на вопросы в закрытых чатах. Это превращает учебную аудиторию в интерактивное пространство, к которому могут присоединиться участники с разным уровнем, и каждый получит поддержку и помощь.
  2. Профессия как ремесло.  Поскольку дата-сайентисты — это прежде всего технологи-практики, все полученные знания сразу применяются в кейсах. Для этого в рамках курсов machine learning и deep learning организуются командные и индивидуальные соревнования в Kaggle, а некоторые наставники проводят и собственные конкурсы. В итоге студенты сразу получают практически ориентированный инструментарий, с которым не стыдно идти на собеседование.
  3. Всё, как в жизни. Наши преподаватели обеспечивают реальный контекст для всех своих уроков. Практически в каждом модуле студенты работают с некой рабочей ситуацией, которая требует от них проанализировать данные, построить прогноз или оптимизировать модель. Таким образом, обучение начинается с тренажерных задач, затем переходит в бизнес-ориентированным проблемам, а завершается соревнованиями, где участники сами выбирают, какие средства помогут им в той или иной ситуации.

В SkillFactory новый курс по Data Science стартует каждый месяц, так что присоединиться к сообществу никогда не поздно. Подробная информация об обучении и организационные детали — на странице специализации.

текст: Помогаев Дмитрий

Поделиться: