Как успешно пройти собеседование на Data Scientist?

Разбираем типичные вопросы на собеседованиях и распространенные ошибки

Собеседование — один из ключевых этапов при приеме на работу, наряду с составлением резюме и тестовым заданием. Вместе с Юлией Пушкиной, директором карьерного центра SkillFactory, разбираемся, из чего может состоять разговор работодателя и кандидата в сфере Data Science. 

В разных компаниях собеседования на должность дата-сайентиста проходят по-разному, но основные этапы похожи везде: технические вопросы и задания (главный и, как правило, самый долгий этап), к которым иногда добавляют тестирование на мышление, логику и восприятие информации, вопросы для оценки вовлеченности в профессию и ответы на вопросы кандидата.

Перед собеседованием уточните, из каких этапов оно будет состоять. Так вы избежите неприятных сюрпризов.

Технические вопросы и задания

На этом этапе интервьюеру важно понять, соответствуют ли ваши знания и навыки должности, на которую вы претендуете, и можете ли вы применять их на практике. Вам могут задавать вопросы устно или дать задания, которые нужно выполнить за ограниченное время. Иногда этот этап включает и опрос, и здания. Вот основные разделы, которые стоит повторить.

Статистика и математика

Если кандидат знает основы статистики, значит, он понимает, на основе чего работают алгоритмы и библиотеки.

Пример вопроса: Есть набор данных. Он содержит недостающие значения, которые распределены вдоль одного стандартного отклонения от медианы. Какой процент данных останется неизменным? Почему?

Ответ: В этом вопросе есть подсказка: так как данные распределены по медиане, можно предположить, что речь идет о нормальном распределении. Нам известно, что при нормальном распределении ~68% данных лежит в одном стандартном отклонении от медианы, а значит, ~32% данных остается неизменным. Таким образом, ~32% данных останется неизменным при недостающих значениях.

Вопросы из разных разделов статистики можно посмотреть тут:

Машинное обучение — это основная область знаний в Data Science.

Пример вопроса: Какой из перечисленных алгоритмов не использует коэффициент скорости обучения (Learning Rate) в качестве одного из его гиперпараметров?

1. Градиентный бустинг (Gradient Boosting)
2. Extra Trees
3. AdaBoost
4. Случайный лес (Random Forest)

A) 1 and 3
B) 1 and 4
C) 2 and 3
D) 2 and 4

Ответ: D

Подобрали как общие вопросы о машинном обучении, так и задания по конкретным разделам, алгоритмам и методам:

Deep Learning — это область машинного обучения, с помощью которой создаются нейронные сети и математические модели, применяющиеся в распознавании речи и анализе текстов.

Пример вопроса: Какой из следующих методов выполняет операции, аналогичные исключению (Dropout) в нейронной сети?

1. Бэггинг
2. Бустинг
3. Стекинг
4. Ни один из них

Ответ: А. Исключение (Dropout) можно рассматривать как крайнюю форму бэггинга. Подробнее об этом в статье.

Потренироваться решать задачи, связанные с машинным обучением, можно здесь:

Инструменты и языки программирования

Дата-сайентисту нужно владеть хотя бы одним языком программирования. Также неплохо иметь навыки работы с инструментом для анализа данных.

Пример вопроса: Предположим, у вас есть два списка:

a = [1,2,3,4,5]
b = [6,7,8,9]

Задача состоит в том, чтобы создать список, содержащий все элементы a и b в одном измерении.

Output:
a = [1,2,3,4,5,6,7,8,9]

Какой из следующих вариантов вы бы выбрали?

A) a.append(b)
B) a.extend(b)
C) Any of the above
D) Ни один из них

Ответ: В

Подобрали вопросы по популярным языкам и инструментам для анализа данных:

R

Python;

SAS;

SQL.

Тесты

Тестирование на мышление, логику и восприятие информации часто применяют при отборе в консалтинговых компаниях, но в последнее время их включают и в собеседования на позиции, связанные с Data Science. Время на их выполнение сильно ограничено. Это делается, чтобы увидеть, как кандидат мыслит, умеет ли он обрабатывать информацию, делать обоснованные выводы. Пройти пробные тесты можно здесь и здесь.

Курс

Data Scientist

За 12 месяцев вы пополните портфолио рекомендательной системой и нейросетями, примете участие в соревнованиях на Kaggle и в хакатонах. Дополнительная скидка 5% по промокоду BLOG.

Узнать больше

Вопросы на оценку вовлеченности в профессию

Рекрутеры хотят увидеть вашу заинтересованность и знание трендов, поэтому стоит заранее продумать ответы на такие вопросы:

  • Какие специалисты по данным или стартапы, основанные на науке о данных, вам больше всего нравятся и почему?
  • Какие тренды в своей профессиональной области вы знаете?
  • На какие профессиональные ресурсы вы подписаны?
  • Какую профессиональную литературу вы недавно читали?

Какие вопросы подготовить

Если во время общения с интервьюером вы не поняли какую-то информацию об обязанностях и ожиданиях, не стесняйтесь уточнить ее. Также стоит узнать о том, какая в компании и команде атмосфера, каких ценностей они придерживаются и какие перспективы вас ждут, чтобы понять, соотносится ли это с вашими ожиданиями. Вот какие вопросы можно задать:

О должности:

  • Как будет выглядеть отчетность на этой должности? Как часто понадобится ее составлять?
  • Какие карьерные перспективы есть в компании?
  • Каких результатов ожидает команда от специалиста на этой должности?

О компании:

  • Какие возможности для обучения есть в компании?
  • Как обычно строится рабочий день в компании? Бывают ли переработки? С чем они связаны?
  • Над какими проектами сейчас работает команда?
  • Как обстоят дела с корпоративной культурой?

Частые ошибки и как их избежать

1. Прийти на собеседование неподготовленным.

Юлия Пушкина:

Главная ошибка — не готовиться к собеседованию. Хороших кандидатов сейчас много, стоимость подбора выросла, поэтому все страхуются и стараются выбирать самых качественных кандидатов. Собеседования проходят долго и отбор очень сложный, без подготовки не получится его пройти. Нужно повторить все разделы Data Science и практиковаться писать код на языке программирования, который вы знаете.

2. Написать в резюме то, чего вы не знаете.

Если добавить в резюме инструменты, которыми вы не владеете, и задачи, которые вы на самом деле не решали, это выяснится на собеседовании. Интервьюеры часто задают уточняющие вопросы по каждому пункту, который вы написали. Любой опыт можно описать выгодно, но не нужно пытаться обмануть рекрутера.

3. Критиковать предыдущего работодателя или коллег.

Так можно создать впечатление конфликтного человека, который не может ужиться в коллективе. Вопросы о прошлой компании могут выгодно показать вас, если вы ответите, например, что в ней вы достигли «‎потолка»‎. Также можно обозначить, что вы благодарны за опыт и навыки, которые получили.

Поиск работы — долгий процесс, и отказы — часть этого процесса. Надеемся, что они не помешают вам найти работу мечты.

Юлия Пушкина:

Нужно быть готовым к неудаче. Это нормальная составляющая поиска работы, которая тоже может чему-то научить. Недавно в карьерном чате SkillFactory девушка написала, что провалилась на собеседовании и описала задачу, которую не смогла решить. Наши студенты тут же прислали ей варианты решений и написали много поддерживающих сообщений. Думаю, в следующий раз ей будет проще проходить собеседование.

Курс

Data Scientist

За 12 месяцев вы пополните портфолио рекомендательной системой и нейросетями, примете участие в соревнованиях на Kaggle и в хакатонах. Дополнительная скидка 5% по промокоду BLOG.

Узнать больше

(рейтинг: 5, голосов: 5)
Добавить комментарий