Чтобы стать дата-сайентистом, можно засесть за книги, поступить в вуз или пройти хорошие курсы. Рассказываем про преимущества и недостатки всех способов и советуем, с чего начать.
Что такое Data Science?
Data Science — это наука о данных. Ее методы позволяют обрабатывать большие объемы информации. Дата-сайентист строит разные модели, и по их результатам находит неочевидные закономерности и делает прогнозы.
Дата-сайентисты нужны там, где можно извлечь пользу из больших объемов информации: в крупном бизнесе, стартапах, научных организациях. Методы Data Science широко применяются в розничной торговле, банковской сфере, медицине, метеорологии и химии.
Дата-сайентисту важно хорошо знать математику: линейную алгебру, теорию вероятности, статистику, матанализ. Чтобы применять математические модели на практике, нужно знать Python, SQL, уметь работать с библиотеками и фреймворками для машинного обучения. Для более сложных задач понадобится язык С или C++.
Изучать самостоятельно
Плюсы:
- денежных вложений почти не требуется (разве что придется купить несколько учебников);
- можно выбирать время, продолжительность занятий и темп обучения.
Минусы:
- нехватка знакомств в профессиональной сфере (можно восполнить с помощью онлайн-чатов для начинающих, например этого);
- нет возможности оценить актуальность знаний;
- отсутствие наставника;
- высокий риск все бросить, только начав.
Шаг 1. Мониторим рынок
В первую очередь стоит узнать, какие скилы хочет видеть у сотрудника ваш идеальный работодатель. База — это теория вероятности, высшая математика и статистика.
Далее — навыки, связанные непосредственно с профессией. Чаще всего это основы программирования на Python и работа с библиотеками Pandas и NumPy. А еще — выгрузка баз с помощью SQL, работа c файлами, HTML-страницами и API.
Будущие дата-сайентисты должны понимать, как применять для решения бизнес-задач машинное обучение и что оно из себя представляет (Machine Learning — это методы разработки алгоритмов, которые помогают решать задачи на основе поиска закономерностей в различных данных).
Шаг 2. Получаем базовые знания
Конечно, полному гуманитарию на первых порах будет сложно разобраться с большими данными. Рекомендуем начать с прокачки теоретической базы.
Самые крутые теоретические книги:
- «(Не)совершенная случайность», Леонард Млодинов. Увлекательная книга о теории вероятности, роли случая и закономерности в нашей жизни.
- «Голая статистика», Уилан Чарльз. Автор доказывает, что статистика — совсем не скучная, и на живых примерах конкретных компаний объясняет, как работают большие данные.
- YouTube-канал с анимированными роликами, объясняющими основные законы математики.
- «О чем говорят цифры», Том Дэвенпорт и Ким Джин Хо. Книга о том, как сбор данных пригождается в реальной жизни и бизнесе.
Основы Python:
- «Изучаем Python», Марк Лутц. Самая подробная книга об основах этого языка программирования.
- Python Tricks, Дэн Бейдер. Автор пишет о хитрых трюках, которые стоит изучить, если вы хотите программировать быстрее.
- Real Python Tutorials. Сайт для изучения Python с нуля: классные мультики и постепенное погружение.
- Портал, где можно найти информацию по всем основным вопросам, которые возникают в начале пути.
- «Python. К вершинам мастерства», Лучано Рамальо. Отлично подходит для аналитиков — как начинающих, так и продвинутых.
- «Искусственный интеллект с примерами на Python», Пратик Джоши. Подойдет для начинающих погружение в Machine Learning.
Введение в Data Science:
- Numsense! Data Science for the Layman, Су Кеннет, Анналин Ын. Авторы описывают основные принципы работы с большими данными.
- Data Science from Scratch, Грас Джоэл. В этом пособии описаны программные библиотеки, модули, пакеты инструментов и основные платформы. Подходит для начинающих.
- Библиотека материалов по Pandas от канала DataLytics, Алексей Макаров.
- Статья, в которой рассматриваются плюсы и минусы популярных сервисов бизнес-аналитики: Power BI, Qlik Sense, Tableau.
- «SQL для простых смертных», Мартин Грабер. Это пособие для тех, кто никогда не работал с базами данных. Все объясняется пошагово и доступно.
Шаг 3. Выполняем пробные кейсы
Существуют специальные сайты, где проводятся соревнования по анализу больших данных. Самый крупный зарубежный — Kaggle, в русскоязычном сегменте — Boosters.Pro. Здесь крупные компании предлагают решить реальные рабочие задачи, которые можно потом добавить в свое резюме.
Шаг 4. Вливаемся в комьюнити и пишем резюме
На этом этапе уже можно искать профессиональные чатики и просить коллег делиться своим опытом. Не бойтесь задавать вопросы, чтобы в итоге составить для работодателя идеальное резюме. В сфере Data Science спрос на специалистов все еще больше, чем предложение.
Поступить в вуз
Плюсы:
- в университете можно попробовать поступить на бюджет или получить серьезную скидку на обучение (например, такая возможность есть в ВШЭ);
- есть большое поле для нетворкинга;
- возможность изучать дополнительные предметы другого профиля;
- низкая вероятность все бросить из-за поддержки коллектива.
Минусы:
- высокая стоимость платного обучения, полный курс занимает много времени (2 или 4 года в зависимости от уровня);
- необходимо посещать очные занятия;
- многие знания могут быть устаревшими;
- часто много теории и мало практики.
Куда пойти учиться?
Оксана Дереза была филологом, но решила переквалифицироваться — и пошла на «технарскую» магистратуру ВШЭ. В то время, когда Оксана училась в университете, специальных курсов не существовало. Сейчас она — ментор SkillFactory.
Вот несколько вариантов прохождения обучения в области Data Science в России.
Бакалавриат
- Программы МФТИ и Skillfactory — для тех, кто всегда мечтал о физтехе. От 160 000 рублей за семестр.
Программы высшего образования Skillfactory подойдут как для выпускников технических вузов, так и для тех, у кого нет математической подготовки. Поступившие получат все лучшее от академического мира и онлайн-образования: фундаментальную подготовку, практику и стажировки на реальных задачах от компаний-партнеров.
- Бауманка и Mail.Ru — больше возможностей для трудоустройства. От 270 тысяч рублей в год.
Как и в Физтехе, в Бауманке Data Science доступны не всем: сначала нужно изучить основы. На университетскую программу «Технопарк» совместно с российским IT-гигантом могут поступить студенты Бауманки со второго курса и выше — по конкурсу.
Магистратура
- Совместная онлайн-программа НИТУ МИСиС и SkillFactory — для тех, кто хочет учиться из любой точки мира. От 265 тысяч рублей в год (можно взять образовательный кредит).
Абитуриенты должны владеть азами математики и информатики. Но МИСиС ждет на «Науках о данных» не только технарей — для желающих есть подготовительные курсы и консультации.
Диплом онлайн-магистратуры ничем не отличается от «физической» (даже дает отсрочку от армии). Среди преподавателей — университетские профессора и специалисты из Microsoft или BIOCAD. Студенты будут готовить реальные проекты, например для Ростелекома и Nvidia. Партнеры курса обещают помощь с трудоустройством.
- СПбГУ — для любителей Петербурга. От 265 500 рублей в год.
Программа «Исследование операций и системный анализ» предполагает, что абитуриенту уже знакомы прикладная математика и информатика. По крайней мере, конкурс портфолио проводится среди бакалавров и специалистов в этой области.
Университет обещает, что после выпуска магистр сможет работать с большими данными и анализом систем массового обслуживания. Выпускники работают в Сбербанке, Газпроме и Mail.ru.
- МГУ — для поклонников классического образования. От 241 250 рублей в год (вечерняя форма обучения).
Есть целых два направления на выбор: «Интеллектуальный анализ больших данных» и «Большие данные: инфраструктуры и методы решения задач». Поступить без специальной подготовки также будет сложно — абитуриентов ждут вступительные по математике и информатике. Зато после выпуска счастливчиков ждут «Лукойл», «Транснефть» и другие топовые компании.
- НИУ ВШЭ — для тех, у кого международные амбиции. От 675 тысяч рублей в год (но можно получить скидку до 40% при хороших результатах экзаменов).
Вышка предлагает изучать «Науку о данных». Порог вхождения на программу ниже, чем в классические вузы, — сдавать придется только математику (но на английском). Обучение проходит на двух языках.
Студентов ждет двойной диплом с французским университетом Блеза Паскаля — и, как следствие, больше возможностей для трудоустройства за границей. Среди «звезд» факультета — сотрудники Google и Яндекса.
Обучаться онлайн
Плюсы:
- стоимость точно ниже, чем в любом вузе;
- времени на прохождение курса нужно меньше;
- более гибкая система — с онлайн-занятиями и возможностью подстроиться под ученика;
- самые актуальные знания.
Минусы:
- курсы сложно совмещать с интенсивной работой (нужно время на домашние задания).
Как понять, что курс вам подходит?
Оценить успехи выпускников
Обычно онлайн-курсы гордятся своими выпускниками и даже берут у них интервью. Изучите опыт коллег и переложите его на свою образовательную траекторию: так будет проще выбрать ту программу, которая подойдет именно вам.
Читайте: Все истории наших выпускников
Посмотреть, как компания, продающая курсы, помогает в трудоустройстве
В некоторых онлайн-школах есть карьерные центры. Другие дают доступ к эксклюзивным HR-чатам или стажировкам. Изучите, с какими образовательными программами сотрудничает ваша компания мечты. Возможно, это самый короткий путь на лучшее место работы?
Цель карьерного центра SkillFactory — трудоустроить вас после окончания курсов. Эксперты разбирают в закрытых группах резюме и показывают, как строить карьеру на реальных кейсах. Карьерный центр сопровождает учащихся во время и после обучения, организует встречи с рекрутерами, рассылает резюме партнерской сети компаний и готовит к собеседованиям.
Найти то, что вас мотивирует
Мотивация — это то, что поможет пройти курс до конца. Вот три истории выпускников SkillFactory:
Виктор Андрийчук в 38 лет понял, что не преуспел в своей профессии, вдохновился рассказом об искусственном интеллекте и сначала сам изучал Data Science и программирование, а потом поступил на курс в SkillFactory. Теперь он разрабатывает сервис, который будет автоматически с помощью машинного обучения определять, является ли сообщение от клиента спамом
Евгений Денисенко танцевал в ансамбле и работал строителем. Он пробовал себя в разных сферах и в какой-то момент понял, что не хочет быть «специалистом по всему». Евгений решил стать дата-сайентистом с нуля: прошел курс SkillFactory по Data Science и считает это решение одним из лучших в жизни. Сейчас у него есть возможность совмещать математику, программирование и творчество.
Наталья Вольдман посвятила 10 лет центру повышения квалификации, но работа перестала её радовать. Она пробовала работать интернет-маркетологом и изучать программирование, но по совету знакомого стала изучать Data Science и поняла, что это именно то, что ей интересно. Теперь она — старший скоринг-аналитик: разрабатывает и валидирует скоринговые модели по оценке возврата или невозврата займов.
Узнать, останутся ли материалы у вас после прохождения курса
Бывает, что в самом начале рабочего процесса вам нужно уточнить что-то или вернуться к аспекту, который вы не успели достаточно изучить. Материалы пройденного курса могут стать большой поддержкой в таком случае. Узнайте, останутся ли они с вами после завершения учебы.