Баннер мобильный (3) Пройти тест

Что выбрать, чтобы стать дата-сайентистом: самообразование, онлайн-курсы или вуз?

Как освоить базовые навыки Data Science: три главных пути

Разбор

23 июля 2024

Поделиться

Скопировано
Что выбрать, чтобы стать дата-сайентистом: самообразование, онлайн-курсы или вуз?

Содержание

    Чтобы стать дата-сайентистом, можно засесть за книги, поступить в вуз или пройти хорошие курсы. Рассказываем про преимущества и недостатки всех способов и советуем, с чего начать.

    Что такое Data Science?

    Data Science — это наука о данных. Ее методы позволяют обрабатывать большие объемы информации. Дата-сайентист строит разные модели, и по их результатам находит неочевидные закономерности и делает прогнозы.

    Дата-сайентисты нужны там, где можно извлечь пользу из больших объемов информации: в крупном бизнесе, стартапах, научных организациях. Методы Data Science широко применяются в розничной торговле, банковской сфере, медицине, метеорологии и химии.

    Дата-сайентисту важно хорошо знать математику: линейную алгебру, теорию вероятности, статистику, матанализ. Чтобы применять математические модели на практике, нужно знать Python, SQL, уметь работать с библиотеками и фреймворками для машинного обучения. Для более сложных задач понадобится язык С или C++.

    Изучать самостоятельно

    Плюсы:

    • денежных вложений почти не требуется (разве что придется купить несколько учебников);
    • можно выбирать время, продолжительность занятий и темп обучения.

    Минусы:

    • нехватка знакомств в профессиональной сфере (можно восполнить с помощью онлайн-чатов для начинающих, например этого);
    • нет возможности оценить актуальность знаний;
    • отсутствие наставника;
    • высокий риск все бросить, только начав.

    Шаг 1. Мониторим рынок

    В первую очередь стоит узнать, какие скилы хочет видеть у сотрудника ваш идеальный работодатель. База — это теория вероятности, высшая математика и статистика.

    Далее — навыки, связанные непосредственно с профессией. Чаще всего это основы программирования на Python и работа с библиотеками Pandas и NumPy. А еще — выгрузка баз с помощью SQL, работа c файлами, HTML-страницами и API.

    Будущие дата-сайентисты должны понимать, как применять для решения бизнес-задач машинное обучение и что оно из себя представляет (Machine Learning — это методы разработки алгоритмов, которые помогают решать задачи на основе поиска закономерностей в различных данных).

    Шаг 2. Получаем базовые знания

    Конечно, полному гуманитарию на первых порах будет сложно разобраться с большими данными. Рекомендуем начать с прокачки теоретической базы.

    Самые крутые теоретические книги:

    1. «(Не)совершенная случайность», Леонард Млодинов. Увлекательная книга о теории вероятности, роли случая и закономерности в нашей жизни.
    2. «Голая статистика», Уилан Чарльз. Автор доказывает, что статистика — совсем не скучная, и на живых примерах конкретных компаний объясняет, как работают большие данные.
    3. YouTube-канал с анимированными роликами, объясняющими основные законы математики.
    4. «О чем говорят цифры», Том Дэвенпорт и Ким Джин Хо. Книга о том, как сбор данных пригождается в реальной жизни и бизнесе.

    Основы Python:

    1. «Изучаем Python», Марк Лутц. Самая подробная книга об основах этого языка программирования.
    2. Python Tricks, Дэн Бейдер. Автор пишет о хитрых трюках, которые стоит изучить, если вы хотите программировать быстрее.
    3. Real Python Tutorials. Сайт для изучения Python с нуля: классные мультики и постепенное погружение.
    4. Портал, где можно найти информацию по всем основным вопросам, которые возникают в начале пути.
    5. «Python. К вершинам мастерства», Лучано Рамальо. Отлично подходит для аналитиков — как начинающих, так и продвинутых.
    6. «Искусственный интеллект с примерами на Python», Пратик Джоши. Подойдет для начинающих погружение в Machine Learning.

    Введение в Data Science:

    1. Numsense! Data Science for the Layman, Су Кеннет, Анналин Ын. Авторы описывают основные принципы работы с большими данными.
    2. Data Science from Scratch, Грас Джоэл. В этом пособии описаны программные библиотеки, модули, пакеты инструментов и основные платформы. Подходит для начинающих.
    3. Библиотека материалов по Pandas от канала DataLytics, Алексей Макаров.
    4. Статья, в которой рассматриваются плюсы и минусы популярных сервисов бизнес-аналитики: Power BI, Qlik Sense, Tableau.
    5. «SQL для простых смертных», Мартин Грабер. Это пособие для тех, кто никогда не работал с базами данных. Все объясняется пошагово и доступно.

    Шаг 3. Выполняем пробные кейсы

    Существуют специальные сайты, где проводятся соревнования по анализу больших данных. Самый крупный зарубежный — Kaggle, в русскоязычном сегменте — Boosters.Pro. Здесь крупные компании предлагают решить реальные рабочие задачи, которые можно потом добавить в свое резюме.

    Шаг 4. Вливаемся в комьюнити и пишем резюме

    На этом этапе уже можно искать профессиональные чатики и просить коллег делиться своим опытом. Не бойтесь задавать вопросы, чтобы в итоге составить для работодателя идеальное резюме. В сфере Data Science спрос на специалистов все еще больше, чем предложение.

    Поступить в вуз

    Плюсы:

    • в университете можно попробовать поступить на бюджет или получить серьезную скидку на обучение (например, такая возможность есть в ВШЭ);
    • есть большое поле для нетворкинга;
    • возможность изучать дополнительные предметы другого профиля;
    • низкая вероятность все бросить из-за поддержки коллектива.

    Минусы:

    • высокая стоимость платного обучения, полный курс занимает много времени (2 или 4 года в зависимости от уровня);
    • необходимо посещать очные занятия;
    • многие знания могут быть устаревшими;
    • часто много теории и мало практики.

    Куда пойти учиться?

    Оксана Дереза была филологом, но решила переквалифицироваться — и пошла на «технарскую» магистратуру ВШЭ. В то время, когда Оксана училась в университете, специальных курсов не существовало. Сейчас она — ментор SkillFactory.

    Вот несколько вариантов прохождения обучения в области Data Science в России.

    Бакалавриат

    • Программы МФТИ и Skillfactory — для тех, кто всегда мечтал о физтехе. От 160 000 рублей за семестр.

    Программы высшего образования Skillfactory подойдут как для выпускников технических вузов, так и для тех, у кого нет математической подготовки. Поступившие получат все лучшее от академического мира и онлайн-образования: фундаментальную подготовку, практику и стажировки на реальных задачах от компаний-партнеров.

    • Бауманка и Mail.Ru — больше возможностей для трудоустройства. От 270 тысяч рублей в год.

    Как и в Физтехе, в Бауманке Data Science доступны не всем: сначала нужно изучить основы. На университетскую программу «Технопарк» совместно с российским IT-гигантом могут поступить студенты Бауманки со второго курса и выше — по конкурсу.

    Магистратура

    • Совместная онлайн-программа НИТУ МИСиС и SkillFactory — для тех, кто хочет учиться из любой точки мира. От 265 тысяч рублей в год (можно взять образовательный кредит).

    Абитуриенты должны владеть азами математики и информатики. Но МИСиС ждет на «Науках о данных» не только технарей — для желающих есть подготовительные курсы и консультации.

    Диплом онлайн-магистратуры ничем не отличается от «физической» (даже дает отсрочку от армии). Среди преподавателей — университетские профессора и специалисты из Microsoft или BIOCAD. Студенты будут готовить реальные проекты, например для Ростелекома и Nvidia. Партнеры курса обещают помощь с трудоустройством.

    • СПбГУ — для любителей Петербурга. От 265 500 рублей в год.

    Программа «Исследование операций и системный анализ» предполагает, что абитуриенту уже знакомы прикладная математика и информатика. По крайней мере, конкурс портфолио проводится среди бакалавров и специалистов в этой области.

    Университет обещает, что после выпуска магистр сможет работать с большими данными и анализом систем массового обслуживания. Выпускники работают в Сбербанке, Газпроме и Mail.ru.

    • МГУ — для поклонников классического образования. От 241 250 рублей в год (вечерняя форма обучения).

    Есть целых два направления на выбор: «Интеллектуальный анализ больших данных» и «Большие данные: инфраструктуры и методы решения задач». Поступить без специальной подготовки также будет сложно — абитуриентов ждут вступительные по математике и информатике. Зато после выпуска счастливчиков ждут «Лукойл», «Транснефть» и другие топовые компании.

    • НИУ ВШЭ — для тех, у кого международные амбиции. От 675 тысяч рублей в год (но можно получить скидку до 40% при хороших результатах экзаменов).

    Вышка предлагает изучать «Науку о данных». Порог вхождения на программу ниже, чем в классические вузы, — сдавать придется только математику (но на английском). Обучение проходит на двух языках.

    Студентов ждет двойной диплом с французским университетом Блеза Паскаля — и, как следствие, больше возможностей для трудоустройства за границей. Среди «звезд» факультета — сотрудники Google и Яндекса.

    Обучаться онлайн

    Плюсы:

    • стоимость точно ниже, чем в любом вузе;
    • времени на прохождение курса нужно меньше;
    • более гибкая система — с онлайн-занятиями и возможностью подстроиться под ученика;
    • самые актуальные знания.

    Минусы:

    • курсы сложно совмещать с интенсивной работой (нужно время на домашние задания).

    Я думаю, что здесь можно говорить не столько про минусы, сколько про сложности. У студента должен быть высокий уровень самоорганизации. Нужно быть готовым к тому, что, приняв решение об обучении, придется жить в условиях постоянных дедлайнов. Data Science — сложная сфера. Нужно настроиться на интенсивную работу

    Юлия Пушкина, руководитель карьерного центра SkillFactory

    Как понять, что курс вам подходит?

    Оценить успехи выпускников

    Обычно онлайн-курсы гордятся своими выпускниками и даже берут у них интервью. Изучите опыт коллег и переложите его на свою образовательную траекторию: так будет проще выбрать ту программу, которая подойдет именно вам.

    Читайте: Все истории наших выпускников

    Посмотреть, как компания, продающая курсы, помогает в трудоустройстве

    В некоторых онлайн-школах есть карьерные центры. Другие дают доступ к эксклюзивным HR-чатам или стажировкам. Изучите, с какими образовательными программами сотрудничает ваша компания мечты. Возможно, это самый короткий путь на лучшее место работы?

    Цель карьерного центра SkillFactory — трудоустроить вас после окончания курсов. Эксперты разбирают в закрытых группах резюме и показывают, как строить карьеру на реальных кейсах. Карьерный центр сопровождает учащихся во время и после обучения, организует встречи с рекрутерами, рассылает резюме партнерской сети компаний и готовит к собеседованиям.

    Найти то, что вас мотивирует

    Мотивация — это то, что поможет пройти курс до конца. Вот три истории выпускников SkillFactory:

    Виктор Андрийчук в 38 лет понял, что не преуспел в своей профессии, вдохновился рассказом об искусственном интеллекте и сначала сам изучал Data Science и программирование, а потом поступил на курс в SkillFactory. Теперь он разрабатывает сервис, который будет автоматически с помощью машинного обучения определять, является ли сообщение от клиента спамом

    Евгений Денисенко танцевал в ансамбле и работал строителем. Он пробовал себя в разных сферах и в какой-то момент понял, что не хочет быть «специалистом по всему». Евгений решил стать дата-сайентистом с нуля: прошел курс SkillFactory по Data Science и считает это решение одним из лучших в жизни. Сейчас у него есть возможность совмещать математику, программирование и творчество.

    Наталья Вольдман посвятила 10 лет центру повышения квалификации, но работа перестала её радовать. Она пробовала работать интернет-маркетологом и изучать программирование, но по совету знакомого стала изучать Data Science и поняла, что это именно то, что ей интересно. Теперь она — старший скоринг-аналитик: разрабатывает и валидирует скоринговые модели по оценке возврата или невозврата займов.

    Узнать, останутся ли материалы у вас после прохождения курса

    Бывает, что в самом начале рабочего процесса вам нужно уточнить что-то или вернуться к аспекту, который вы не успели достаточно изучить. Материалы пройденного курса могут стать большой поддержкой в таком случае. Узнайте, останутся ли они с вами после завершения учебы.

    Разбор

    Поделиться

    Скопировано
    0 комментариев
    Комментарии