success story

История успеха: как из кельтолога переквалифицирвоаться в Data Scientist?

Многие из специальностей, которым обучают в SkillFactory, рассчитаны на новичков — тех, кто собирается начать обучение с нуля. Однако студентам бывает сложно поверить, что такая сложная специальность — и без базовых знаний. Многим кажется, что нужно уже уметь программировать и иметь пятёрку по математике в аттестате. Но дата-сайентистом может стать любой: мы поговорили с Оксаной Дерезой, которая за год из кельтолога переквалифицировалась в специалиста по data science.

Оксана закончила филологический факультет МГУ, и до того, как прийти в data science, занималась преподаванием языков (английский, ирландский) и письменным переводом с английского, датского, французского, и ирландского на русский.

SkillFactory: Как и почему вы начали заниматься наукой о данных?

Оксана: Когда я заканчивала 5 курс, я начала работать аналитиком веб-данных в Лаборатории Касперского. Благодаря этой работе я поняла, что мне хотелось бы не просто собирать и размечать данные, а решать более интересные задачи с ними, и заинтересовалась IT в целом.

SF: Расскажите, как вы пришли к изучению анализа данных?

O.: Я решила, что не хочу полностью уходить от своей первой специальности и что интереснее всего мне было бы работать с текстовыми данными, поэтому, закончив МГУ, я поступила в магистратуру по компьютерной лингвистике в московскую Вышку (НИУ ВШЭ). На тот момент это была лучшая магистратура по компьютерной лингвистике в России, судя по отзывам и карьерному пути выпускников. Параллельно с обучением в магистратуре я дополнительно проходила курсы по программированию, машинному обучению и NLP на Coursera и edX.

SF: Как и где вы искали материалы для обучения?

O.: В некотором смысле все было уже сделано за меня: магистерская программа включала в себя все необходимое — от линейной алгебры до машинного перевода. Что касается онлайн-курсов, какие-то из них советовали однокурсники, а какие-то я выбирала, ориентируясь на то, кто их читает: для меня в приоритете были известные ученые и data scientist’ы вроде Кристофера Мэннинга и Эндрю Ына. Еще мы с однокурсниками часто ходили на открытые лекции и семинары в Яндекс, Mail.ru и т.п. — о таких событиях, как правило, нам рассказывали преподаватели, или же мы узнавали о них из тематических рассылок и групп в соцсетях.

SF: Из каких источников вы брали информацию? И правда ли, что если не знаешь английский, то у тебя нет шансов?

O.: В основном это были англоязычные, потому что когда я училась в магистратуре (2015–2017 гг.), русскоязычных ресурсов особо не было. Сейчас с ними все обстоит гораздо лучше: переведено уже много книг издательства O’Reilly, появляются книжки по машинному обучению и data science российских авторов (например, «Глубокое обучение. Погружение в мир нейронных сетей» С. Николенко, А. Кадурина и Е. Архангельской). То же самое можно сказать об онлайн-курсах: большую работу в этом направлении ведут, например, Яндекс и ФКН НИУ ВШЭ. Так что сейчас английский уже не является барьером для изучения data science; единственная серьезная проблема, с которой придется столкнуться без знания английского, — это чтение документации библиотек.

SF: С какими сложностями пришлось столкнуться в процессе обучения?

O.: Самой главной сложностью лично для меня было вспомнить математику и разобраться в алгоритмах. Решала я эти проблемы банально — много занималась. А еще мы с однокурсниками всегда помогали друг другу, вместе разбирались в непонятных темах. Я бы сказала, что ключевыми факторами успеха в моем случае были целеустремленность и командная работа.

DS
Специализация Data Science
Идет набор в группу 12 500₽ в месяц

SF: Сколько времени прошло с момента, когда вы начали изучать data science, до первой работы по новой специальности?

O.: Поскольку я уже работала в IT-компании, когда начала изучать data science, мне просто постепенно стали давать новые задачи, связанные с программированием и анализом данных. Через год учебы я уже полностью перешла с задач веб-аналитика на задачи компьютерного лингвиста.

SF: Какими задачами вам приходится заниматься?

O.: В индустрии я делала довольно типичные вещи вроде классификации обращений в техподдержку или поисковых запросов, анализа тональности отзывов и т.п. Как исследователь я занимаюсь, главным образом, диахроническими языковыми моделями.

SF: Что больше всего бесит и что больше всего вам нравится в профессии?

O.: Бесит — сидеть целый день за компьютером, нравится — то, что многие задачи в data science включают в себя исследовательский элемент: какие данные взять, как их обработать, какие признаки выбрать для обучения модели, какая архитектура даст оптимальный результат… Ну и расслабленная и дружелюбная атмосфера в IT в целом. 

SF: Как изменилась ваша зарплата после начала карьеры в Data Science?

O.: Моя зарплата внутри одной компании выросла примерно в два раза, но, надо сказать, что и работать я начала побольше. Впрочем, в какой-то момент мне стало скучновато и захотелось вернуться в академическую среду, поэтому я уволилась из ЛК и начала преподавать в Вышке программирование и NLP, параллельно занимаясь собственными исследованиями, а через два года уехала в Ирландию писать PhD. Надо сказать, что последние два события на зарплате сказались отрицательно, но я рассматриваю это как инвестицию в будущее.

SF: На какие качества дата-сайентиста смотрят при найме на работу?

O.: Не могу ответить на этот вопрос, потому что я просто сменила область задач в рамках одной компании и не проходила ни одного собеседования на новую позицию.

SF: Вы не пожалели о своем решении?

O.: Нет, потому что теперь я могу совмещать в своей работе и исследованиях две совершенно разных области, и у меня гораздо больше выбор дальнейших путей развития карьеры. Ну и, в конце концов, data scientist зарабатывает во много раз больше преподавателя языка или переводчика, хотя, как ни странно, это не было частью моей мотивации для перехода.

SF: Дадите какой-нибудь совет для тех, кто хочет проникнуть в науку о данных?

O.: Я бы сказала, что сейчас везде смотрят не на дипломы и сертификаты, а на то, что ты умеешь, поэтому главный совет — собирайте портфолио на GitHub, участвуйте в соревнованиях на Kaggle и в хакатонах от IT-компаний. Еще полезно ходить на мероприятия, посвященные data science, которые эти компании организуют — например, Sberbank Data Science / AI Journey. Помимо того, что на таких мероприятиях можно послушать ведущих российских и зарубежных data scientist’ов и даже с ними познакомиться, там часто бывают рекрутеры компании-организатора.

SF: Насколько реально найти работу за границей (с переездом или удалённо)?

O.: Рынок IT стремительно растет во всем мире, хороших специалистов не хватает, поэтому найти работу data scientist’a за рубежом вполне реально — знаю немало примеров. Я уехала немного с другой целью — писать диссертацию (PhD), но все происходило совершенно как при приеме на работу: никаких мотивационных писем и research proposal, только резюме и техническое собеседование. Оно не показалось мне сложным, потому что я подавалась в проект, для которого мои исследовательские интересы и экспертиза подходили идеально, поэтому с решением задач у меня проблем не возникло.

Сейчас Оксана — кандидат PhD и исследователь в Insight Centre for Data Analytics, в Национальном университете Ирландия Голуэй.

Поделиться: