Что выбрать, чтобы стать дата-сайентистом: самообразование, онлайн-курсы или вуз?

Как освоить базовые навыки Data Science: три главных пути

Чтобы стать дата-сайентистом, можно засесть за книги, поступить в вуз или пройти хорошие курсы. Рассказываем про преимущества и недостатки всех способов и советуем, с чего начать.

Что такое Data Science?

Data Science — это наука о данных. Ее методы позволяют обрабатывать большие объемы информации. Дата-сайентист строит разные модели, и по их результатам находит неочевидные закономерности и делает прогнозы.

Дата-сайентисты нужны там, где можно извлечь пользу из больших объемов информации: в крупном бизнесе, стартапах, научных организациях. Методы Data Science широко применяются в розничной торговле, банковской сфере, медицине, метеорологии и химии.

Дата-сайентисту важно хорошо знать математику: линейную алгебру, теорию вероятности, статистику, матанализ. Чтобы применять математические модели на практике, нужно знать Python, SQL, уметь работать с библиотеками и фреймворками для машинного обучения. Для более сложных задач понадобится язык С или C++.

Изучать самостоятельно

Плюсы:

? денежных вложений почти не требуется (разве что придется купить несколько учебников);

? можно выбирать время, продолжительность занятий и темп обучения.

Минусы:

? нехватка знакомств в профессиональной сфере (можно восполнить с помощью онлайн-чатов для начинающих, например этого);

? нет возможности оценить актуальность знаний;

? отсутствие наставника;

? высокий риск все бросить, только начав.

Шаг 1. Мониторим рынок

В первую очередь стоит узнать, какие скилы хочет видеть у сотрудника ваш идеальный работодатель. База — это теория вероятности, высшая математика и статистика.

Далее — навыки, связанные непосредственно с профессией. Чаще всего это основы программирования на Python и работа с библиотеками Pandas и NumPy. А еще — выгрузка баз с помощью SQL, работа c файлами, HTML-страницами и API.

Будущие дата-сайентисты должны понимать, как применять для решения бизнес-задач машинное обучение и что оно из себя представляет (Machine Learning — это методы разработки алгоритмов, которые помогают решать задачи на основе поиска закономерностей в различных данных).

Шаг 2. Получаем базовые знания

Конечно, полному гуманитарию на первых порах будет сложно разобраться с большими данными. Рекомендуем начать с прокачки теоретической базы.

Самые крутые теоретические книги:

  1. «(Не)совершенная случайность», Леонард Млодинов. Увлекательная книга о теории вероятности, роли случая и закономерности в нашей жизни.
  2. «Голая статистика», Уилан Чарльз. Автор доказывает, что статистика — совсем не скучная, и на живых примерах конкретных компаний объясняет, как работают большие данные.
  3. YouTube-канал с анимированными роликами, объясняющими основные законы математики.
  4. «О чем говорят цифры», Том Дэвенпорт и Ким Джин Хо. Книга о том, как сбор данных пригождается в реальной жизни и бизнесе.

Основы Python:

  1. «Изучаем Python», Марк Лутц. Самая подробная книга об основах этого языка программирования.
  2. Python Tricks, Дэн Бейдер. Автор пишет о хитрых трюках, которые стоит изучить, если вы хотите программировать быстрее.
  3. Real Python Tutorials. Сайт для изучения Python с нуля: классные мультики и постепенное погружение.
  4. Портал, где можно найти информацию по всем основным вопросам, которые возникают в начале пути.
  5. «Python. К вершинам мастерства», Лучано Рамальо. Отлично подходит для аналитиков — как начинающих, так и продвинутых.
  6. «Искусственный интеллект с примерами на Python», Пратик Джоши. Подойдет для начинающих погружение в Machine Learning.

Введение в Data Science:

  1. Numsense! Data Science for the Layman, Су Кеннет, Анналин Ын. Авторы описывают основные принципы работы с большими данными.
  2. Data Science from Scratch, Грас Джоэл. В этом пособии описаны программные библиотеки, модули, пакеты инструментов и основные платформы. Подходит для начинающих.
  3. Библиотека материалов по Pandas от канала DataLytics, Алексей Макаров.
  4. Статья, в которой рассматриваются плюсы и минусы популярных сервисов бизнес-аналитики: Power BI, Qlik Sense, Tableau.
  5. «SQL для простых смертных», Мартин Грабер. Это пособие для тех, кто никогда не работал с базами данных. Все объясняется пошагово и доступно.

Шаг 3. Выполняем пробные кейсы

Существуют специальные сайты, где проводятся соревнования по анализу больших данных. Самый крупный зарубежный — Kaggle, в русскоязычном сегменте — Boosters.Pro. Здесь крупные компании предлагают решить реальные рабочие задачи, которые можно потом добавить в свое резюме.

Шаг 4. Вливаемся в комьюнити и пишем резюме

На этом этапе уже можно искать профессиональные чатики и просить коллег делиться своим опытом. Не бойтесь задавать вопросы, чтобы в итоге составить для работодателя идеальное резюме. В сфере Data Science спрос на специалистов все еще больше, чем предложение.

Поступить в вуз

Плюсы:

? в университете можно попробовать поступить на бюджет или получить серьезную скидку на обучение (например, такая возможность есть в ВШЭ);

? есть большое поле для нетворкинга;

? возможность изучать дополнительные предметы другого профиля;

? низкая вероятность все бросить из-за поддержки коллектива.

Минусы:

? высокая стоимость платного обучения, полный курс занимает много времени (2 или 4 года в зависимости от уровня);

? необходимо посещать очные занятия;

? многие знания могут быть устаревшими;

? часто много теории и мало практики.

Куда пойти учиться?

Оксана Дереза была филологом, но решила переквалифицироваться — и пошла на «технарскую» магистратуру ВШЭ. В то время, когда Оксана училась в университете, специальных курсов не существовало. Сейчас она — ментор SkillFactory.

Вот несколько вариантов прохождения обучения в области Data Science в России.

Бакалавриат

  • Программа МФТИ и Яндекса — для тех, кто всегда мечтал о физтехе. От 270 тысяч рублей в год.

Попасть на программу можно только с третьего или четвертого курса бакалавриата прикладной математики и информатики (или физики). Отбор ведется среди студентов второго года обучения, и попадают только лучшие. Но зато поступившие на программу получают возможность пройти стажировку или практику в Яндексе.

  • Бауманка и Mail.Ru — больше возможностей для трудоустройства. От 270 тысяч рублей в год.

Как и в Физтехе, в Бауманке Data Science доступны не всем: сначала нужно изучить основы. На университетскую программу «Технопарк» совместно с российским IT-гигантом могут поступить студенты Бауманки со второго курса и выше — по конкурсу.

Магистратура

  • Совместная онлайн-программа НИТУ МИСиС и SkillFactory — для тех, кто хочет учиться из любой точки мира. От 265 тысяч рублей в год (можно взять образовательный кредит).

Абитуриенты должны владеть азами математики и информатики. Но МИСиС ждет на «Науках о данных» не только технарей — для желающих есть подготовительные курсы и консультации.

Диплом онлайн-магистратуры ничем не отличается от «физической» (даже дает отсрочку от армии). Среди преподавателей — университетские профессора и специалисты из Microsoft или BIOCAD. Студенты будут готовить реальные проекты, например для Ростелекома и Nvidia. Партнеры курса обещают помощь с трудоустройством.

  • СПбГУ — для любителей Петербурга. От 265 500 рублей в год.

Программа «Исследование операций и системный анализ» предполагает, что абитуриенту уже знакомы прикладная математика и информатика. По крайней мере, конкурс портфолио проводится среди бакалавров и специалистов в этой области.

Университет обещает, что после выпуска магистр сможет работать с большими данными и анализом систем массового обслуживания. Выпускники работают в Сбербанке, Газпроме и Mail.ru.

  • МГУ — для поклонников классического образования. От 241 250 рублей в год (вечерняя форма обучения).

Есть целых два направления на выбор: «Интеллектуальный анализ больших данных» и «Большие данные: инфраструктуры и методы решения задач». Поступить без специальной подготовки также будет сложно — абитуриентов ждут вступительные по математике и информатике. Зато после выпуска счастливчиков ждут «Лукойл», «Транснефть» и другие топовые компании.

  • НИУ ВШЭ — для тех, у кого международные амбиции. От 675 тысяч рублей в год (но можно получить скидку до 40% при хороших результатах экзаменов).

Вышка предлагает изучать «Науку о данных». Порог вхождения на программу ниже, чем в классические вузы, — сдавать придется только математику (но на английском). Обучение проходит на двух языках.

Студентов ждет двойной диплом с французским университетом Блеза Паскаля — и, как следствие, больше возможностей для трудоустройства за границей. Среди «звезд» факультета — сотрудники Google и Яндекса.

Обучаться онлайн

Плюсы:

? стоимость точно ниже, чем в любом вузе;

? времени на прохождение курса нужно меньше;

? более гибкая система — с онлайн-занятиями и возможностью подстроиться под ученика;

? самые актуальные знания.

Минусы:

? курсы сложно совмещать с интенсивной работой (нужно время на домашние задания).

«Я думаю, что здесь можно говорить не столько про минусы, сколько про сложности: 
— у студента должен быть высокий уровень самоорганизации;
— приняв решение об обучении, придется жить в условиях постоянных дедлайнов;
— будет очень непросто. Data Science — сложная сфера. Нужно настроиться на интенсивную работу» , — считает Юлия Пушкина, руководитель карьерного центра SkillFactory.

Как понять, что курс вам подходит?

Оценить успехи выпускников

Обычно онлайн-курсы гордятся своими выпускниками и даже берут у них интервью. Изучите опыт коллег и переложите его на свою образовательную траекторию: так будет проще выбрать ту программу, которая подойдет именно вам.

Посмотреть, как компания, продающая курсы, помогает в трудоустройстве

В некоторых онлайн-школах есть карьерные центры. Другие дают доступ к эксклюзивным HR-чатам или стажировкам. Изучите, с какими образовательными программами сотрудничает ваша компания мечты. Возможно, это самый короткий путь на лучшее место работы?

Цель карьерного центра SkillFactory — трудоустроить вас после окончания курсов. Эксперты разбирают в закрытых группах резюме и показывают, как строить карьеру на реальных кейсах. Карьерный центр сопровождает учащихся во время и после обучения, организует встречи с рекрутерами, рассылает резюме партнерской сети компаний и готовит к собеседованиям.

Найти то, что вас мотивирует

Мотивация — это то, что поможет пройти курс до конца. Вот три истории выпускников SkillFactory:

Виктор Андрийчук в 38 лет понял, что не преуспел в своей профессии, вдохновился рассказом об искусственном интеллекте и сначала сам изучал Data Science и программирование, а потом поступил на курс в SkillFactory. Теперь он разрабатывает сервис, который будет автоматически с помощью машинного обучения определять, является ли сообщение от клиента спамом

Евгений Денисенко танцевал в ансамбле и работал строителем. Он пробовал себя в разных сферах и в какой-то момент понял, что не хочет быть «специалистом по всему». Евгений решил стать дата-сайентистом с нуля: прошел курс SkillFactory по Data Science и считает это решение одним из лучших в жизни. Сейчас у него есть возможность совмещать математику, программирование и творчество.

Наталья Вольдман посвятила 10 лет центру повышения квалификации, но работа перестала её радовать. Она пробовала работать интернет-маркетологом и изучать программирование, но по совету знакомого стала изучать Data Science и поняла, что это именно то, что ей интересно. Теперь она — старший скоринг-аналитик: разрабатывает и валидирует скоринговые модели по оценке возврата или невозврата займов.

Узнать, останутся ли материалы у вас после прохождения курса

Бывает, что в самом начале рабочего процесса вам нужно уточнить что-то или вернуться к аспекту, который вы не успели достаточно изучить. Материалы пройденного курса могут стать большой поддержкой в таком случае. Узнайте, останутся ли они с вами после завершения учебы.

Автор: Лариса Ступина

(рейтинг: 5, голосов: 1)
Добавить комментарий