Баннер мобильный (2) Научиться

Как разобраться в Data Science

Рассказываем, какие специалисты занимаются big data и с чего начать изучение науки о данных

Статьи

28 марта 2023

Поделиться

Скопировано
Как разобраться в Data Science

Содержание

    Data Science — очень трендовая тема. Специалиста в этой области, Data Scientist, уже назвали самой «сексуальной» профессией XXI века. Мы собрали полезные статьи, мастер-классы и онлайн-курсы, которые помогут вам самостоятельно разобраться в этой теме и составить собственное впечатление.

    Взрыв data science

    Почему data science вызывает такой интерес? Основная причина — это скрытая эффективность, которая содержится в данных. Любая компания собирает данные. И их анализ позволяет делать более совершенные продукты, привлекать больше целевых клиентов и удерживать их, усовершенствовать бизнес-процессы и многое другое.

    Почему data science воспринимается как некая «волшебная пилюля»? Основной принцип состоит в том, что data science позволяет делать объективные выводы из имеющихся данных, свободные от предвзятости или предрассудков, свойственных для человека.

    Спрос со стороны бизнеса рождает и большой спрос на специалистов. Только в США в ближайшие три года ожидается нехватка порядка 190 тысяч специалистов по данным. Интерес соискателей также не заставил себя ждать:

    Кто такой Data Scientist?

    Data scientist исследует данные, чтобы отыскать скрытые закономерности и делать прогнозы о том, как будут развиваться события в будущем. Data Scientist занимается математическими моделями, программированием и статистикой применительно к необходимой профессиональной области (финансы, банковское дело и т.д.), а также решением конкретных задач, как-то: распознавание мошеннических транзакций, набор генов, соответствующих определенной болезни, финансовые риски для компаний и проч.

    Чтобы решать эти задачи такой специалист должен обладать знаниями и навыками в нескольких областях. Самые важные из них — это математика, программирование, а также понимание бизнеса и стратегии.

    Какие специалисты работают с данными

    Аналитик данных (Data Analyst) — работает с данными в структурированном виде из внутренних систем аналитики, помогает бизнесу суммировать и интерпретировать эти данные. Работает с Excel, SQL и внутренними системами аналитики. В SkillFactory открыт курс «Специализация Аналитик Данных»

    Разработчик BI (Business Intelligence Developer) — занимается проектированием внутренних хранилищ данных, связыванием данных из различных систем, а также созданием дэшбордов и аналитических отчетов. Использует BI-системы (Oracle, IBM и другие), SQL, инструменты ETL и языки программирования.

    Инженер по данным (Data Engineer) — занимается созданием и поддержкой инфраструктурой данных, в частности Big Data. Занимается сбором, хранением и управлением потоками данных в реальном времени. IT-специалист высочайшего уровня, работающий с кластерами серверов на Linux, облачными системами, такими системами обработки больших данных, как Hadoop, Spark и другие. В SkillFactory открыт курс «Специализация Data Engineer»

    Специалист по данным (Data Scientist) — занимается интеллектуальным анализом структурированных и неструктурированных данных. Использует статистику, машинное обучение и продвинутые методы предиктивной аналитики для решения ключевых бизнес-задач. По сравнению с аналитиком данных, специалист по данным должен не только уметь анализировать полученную информацию, но и обладать отличными навыками программирования, уметь разрабатывать новые алгоритмы, обрабатывать большие объемы информации и иметь хорошее представление о той сфере, в которой он применяет свои знания.

    Введение в Data Science и Big Data

    «Специалист по большим данным: где учиться и куда пойти работать»

    • В чем разница между Data Scientist и Data Engineer
    • Где учиться: курсы, магистерские программы и др.
    • Лайфхаки как найти работу

    Подборка видео с неформальных встреч DataTalks на Youtube.

    • Организатор: компания Wargaming
    • Темы: как зарабатывать на данных и машинном обучении, визуализация данных
    • Спикеры: специалисты по анализу данных, бизнес-аналитики

    «Как данные изменят бизнес» (TED)

    • Сжатое и яркое объяснение того, как данные полностью изменили бизнес-стратегию
    • Спикер: вице-президент Boston Consulting Group Филип Эванс
    • Есть расшифровка лекции на русском

    Введение в искусственный интеллект и машинное обучение

    Кто и зачем создает искусственный интеллект?

    • Лекция Байрама Аннакова, основателя App-in-the-Air и Empatika
    • Очень занимательное и наглядное описание того, как развивался искусственный интеллект

    Машинное обучение

    • Вторая лекция Байрама Аннакова
    • Типы машинного обучения и методов создания искусственного интеллекта
    • Множество кейсов и практических советов

    Машинный интеллект и машинное обучение

    • Лекция Андрея Себранта,директора по маркетингу сервисов Яндекса
    • Увлекательное введение в тему с множеством ярких примеров

    Нейросети: доступно о сложном

    • Очень подробная и простая для понимания статья о том, как работают нейронные сети и Deep Learning

    Подборка хороших курсов

    Курс по Machine Learning 

    • Практический курс по машинному обучению с менторской поддержкой
    • Курс содержит полный обзор современных методов машинного обучения от простых моделей до работы с нейросетями и Big Data от опытного практика области

    Онлайн-курс “Машинное обучение и анализ данных”

    • Специализация Яндекса и МФТИ на Coursera на русском языке
    • Полное введение в data science и машинное обучение на базе Python
    • Теорию можно смотреть бесплатно, задания и сертификат — платные

    Dataquest.io

    • Интерактивное пошаговое изучение Data Science с фокусом на Python
    • Обучение через практику: с самого начала работа с реальными данными и кодом
    • 3 направления на выбор: Data Scientist, Data Analyst или Data Engineer

    Datacamp

    • Интерактивный онлайн-курс по Data Science с фокусом на R
    • 66 курсов по машинному обучению, анализу данных и статистике
    • Курс построен на решении практических задач

    «Специализация Аналитик Данных»

    • Специализация включает сквозной курс и тренажёры по инструментам для анализа данных.
    • Срок обучения: 6 месяцев

    Курс по математике для Data Science

    • Курс содержит много практики, которая не ограничивается решением классических уравнений и абстрактных заданий.

    Основы статистики

    • Бесплатное и ясное введение в математическую статистику для всех

    Машинное обучение

    • Легендарный курс основателя Coursera и одного из лучших специалистов по искусственному интеллекту Эндрю Ын (Andrew Ng)
    • Этот курс можно считать индустриальным стандартом по введению в машинное обучение
    • Добрый человек «перевел» задания на Python (в оригинале нужно все делать на Octave)

    Курс по нейронным сетям и deep learning

    • Курс от NVIDIA и SkillFactrory
    • Комплексный курс по глубокому обучению на Python для начинающих

    Видеозаписи лекций Школы анализа данных Яндекса

    • Видеозаписи занятий легендарной Школы анализа данных Яндекса
    • Курсы: машинное обучение, алгоритмы и структуры данных, параллельные вычисления, дискретный анализ и теория вероятности и др.

    «10 онлайн-курсов по машинному обучению»

    • Подборка удаленных образовательных программ, составленная проектом “Теплица социальных технологий”

    «Статистика и котики»

    • Любопытное введение в статистику на примере … котиков
    • Вы получите знания об основах описательной статистики, дисперсионном и корреляционном анализе
    • Фишка курса — наглядность (опять же картинки с котиками)

    Онлайн-курс по Power BI от Needfordata

    • Учит извлекать данные из разных файлов, баз данных и API
    • Преобразовывать данные для удобного анализа
    • Интерпретировать и визуализировать результаты анализа

    Курс по Python для анализа данных

    • Практический курс по Python для аналитиков с менторской поддержкой.

    Онлайн-курс программирования на Python

    • Курс от Высшей школы экономики
    • Онлайн-курс по самому популярному языку программирования для data scientist’ов

    Хорошие конференции и митапы

    Strata+Hadoop World

    • Крупнейшая международная конференция, которая сегодня проводится в крупнейших технологических центрах, таких как Сан-Хосе,Нью-Йорк, Лондон и другие
    • Все звезды и все новинки — здесь
    • Кроме конференции проводятся воркшопы и обучение, возможно также онлайн-участие

    Open Data Science

    • Одно из самых крупных и живых сообществ по анализу данных в рунете
    • В основе — групповой чат Slack
    • Здесь можно проконсультироваться, узнать о новых технологиях, найти работу и найти data scientist’а

    Moscow Data Science

    • Группа, посвященная митапам по Data Science в Москве
    • Анонсы встреч, лекций, мастер-классов, выступлений, обсуждений — все на тему Data Science
    • Для людей, занимающихся и интересующихся анализом, визуализацией данных и майнингом

    Статьи

    Поделиться

    Скопировано

    0 комментариев

    Комментарии