Что нужно знать, чтобы стать дата-сайентистом?

_-data-science-1
Отвечает Эмиль Магеррамов, руководитель группы развития вычислительной химии в BIOCAD.

Это рубрика, в которой эксперты коротко отвечают на актуальные и волнующие вопросы об IT-профессиях, будущем сферы и ее перспективах.

Сейчас на рынке труда специалистов в Data Science очень мало, причем на всех уровнях. На вопрос о том, что нужно знать и уметь, чтобы работать дата-сайентистом, отвечает Эмиль Магеррамов, руководитель группы развития вычислительной химии в BIOCAD.

Принято говорить, что Data Science — это профессия будущего. Последние события показали, что это будущее уже наступило. Новые профессии должны быть связаны не только с открытиями в бизнесе и науке, но и обеспечивать независимость от внешних факторов, финансовую устойчивость, гибкость действий и пр. Дата-сайентисты высоко ценятся и быстро продвигаются по карьерной лестнице. Несмотря на кризис, на конец апреля 2022 года на hh.ru по запросу «Data Scientist» можно найти более 500 вакансий в банковской сфере, логистике, телекоме и пр.

Дата-сайентисты — это люди, которые умеют программировать, но не являются программистами. Они используют технологии искусственного интеллекта и создают модели машинного обучения (нейросети), которые помогают бизнесу анализировать информацию, делать выводы и моделировать картину будущего. Это сейчас актуально, как никогда.

О том, кто такой Data Scientist, мы рассказывали в этой статье

Как и до кризиса, чтобы претендовать на вакансию дата-сайентиста, нужно иметь ряд навыков.

  1. Data Science — прикладная область науки, в которой требуется хорошее знание математики: линейной алгебры, теории вероятности, статистики, математического анализа. Математические модели позволяют найти в данных закономерности и прогнозировать их значения в будущем. Но это не означает, что гуманитарий не сможет работать дата-сайентистом.
  2. Требуется знать современные языки программирования, для которых есть множество специализированных научных библиотек и компонентов для работы с Big Data. Для джуниор-специалиста достаточно знать Python и уметь работать с библиотеками вроде Numpy, Scikit, SciPy, Matplotlib и пр. Для специалистов более высокого уровня потребуется SQL, Java, C++ и другие.
  3. Важно знание предметной области (domain knowledge), в которой ведутся исследования. Дата-сайентисты схватывают все на лету. Например, если вы работаете над проектом по анализу банковских данных, но практически ничего не знаете про экономику, нужно обращаться к экспертизе других людей и постепенно накапливать знания.
  4. Чтобы войти в профессию, необходим английский язык. Большинство документации и книг написаны на английском и на русский не переводились. Это международный язык, на котором люди обмениваются знаниями.

Читайте также:

Если вы хотите задать вопросы эксперту о том, как изменилась сфера IT, напишите их в комментариях под этим постом, в нашей группе во ВКонтакте или в Telegram-канале.

Освойте новую профессию

(рейтинг: 5, голосов: 1)
Добавить комментарий