ML-VS-PR

Отличия машинного обучения от традиционного программирования

Ученые считают, что в будущем Машинное Обучение и ИИ будут применяться в самых разных областях жизнедеятельности человека в качестве помощника или даже полностью исключат участие человека в отдельных профессиях. Сегодня мы встречаем их применение в распознавании лиц в наших телефонах, постановке диагнозов (Watson), рекомендациях фильмов (Nеtflix), возможных друзей (Facebook, Instagram), работников или работодателей (LinkedIn). МО было использовано и в создании всемирно известного каталога идей Pinterest. Каждый месяц сервисом пользуется около 250 млн человек по всему миру, в нем хранится около 175 миллиардов пинов, а 87% пользователей покупают товары благодаря пинам из Pinterest. Если вам интересно узнать больше, то вот вам еще немного нескучной статистики о Pinterest. Невозможно представить, что с таким гигантским пластом данных человек мог бы работать вручную. Чтобы найти для своих пользователей новые идеи, социальная платформа прибегает к машинному обучению. Самообучающаяся система рекомендаций, которая внедрена в Pinterest, постоянно совершенствуется и основывается исключительно на предпочтениях пользователей — пинах, которые они сохраняют.

Курс по Machine Learning
Идет набор в группу 3 800₽ в месяц

Суть машинного обучения

Основная идея машинного обучения состоит в том, что компьютер не просто может использовать заранее написанный алгоритм, но и способен учиться, выявляя закономерности в имеющихся данных и принимая решения с минимальным участием человека. Более подробно с типами машинного обучения и его методами можно ознакомиться в этой краткой, но емкой статье одного из авторов Medium, Madhu Sanjeevi — он использует простые примеры и понятную инфографику. А освоить методы МО и профессию Data Scientist с нуля вместе с преподавателями из Amazon, Яндекса и Nvidia можно на годовом курсе специализация Data Science. По окончании программы у вас будет шанс выиграть в хакатоне, применив все полученные знания. Если сравнить МО и программирование на примере Pinterest, то становится ясно, что МО и ИИ дополняют инструменты традиционного программирования. То есть интерфейс, визуализация данных и другие составляющие Pinterest были написаны на одном из языков программирования (Python, Django или др.), а вот алгоритм рекомендательной системы создавался с помощью машинного обучения. Таким образом, МО не заменяет программирование и не является его усовершенствованным видом, как могло бы сперва показаться. Так, вы не можете попросить Data Scientist построить веб-сайт с помощью методов МО. Основное правило на практике звучит так: используй ресурсы МО, когда традиционное программирование не может решить проблему максимально эффективно. Итак, рассмотрим конкретную задачу, которая стояла когда-то перед командой Pinterest: создать систему рекомендаций для некого пользователя.

Что делает программист?

  • разрабатывает алгоритм
  • пишет код, используя этот алгоритм
  • использует входные данные и получает результат, применив разработанный алгоритм

Чтобы создать алгоритм, нужно учесть множество параметров, обработать большой объем данных и сделать это вручную человеку просто невозможно. Таким образом, программирование позволяет создать примерный алгоритм, основанный на ограниченном наборе данных, которые способен обработать человек.

Курс по нейронным сетям
Идет набор в группу 4 200₽ в месяц

Что делает Data Scientist?

  • собирает статистические данные, чтобы создать полуавтоматическую модель
  • вводит крупные наборы данных в различные алгоритмы МО
  • на выходе получает модель, которая способна создавать новые рекомендации

Дата-инженер может подключиться к коллеге, чтобы доработать обучающий алгоритм и получить разные модели. Та модель, которая даст самую точную рекомендацию, будет выбрана для использования. Pinterest разработал уже несколько рекомендательных моделей и постоянно их совершенствует. О том, как устроена модель Pinnability, рассказывает Yunsong Guo, инженер Pinterest. О другой, более поздней модели, Pixie, и о методах МО, с помощью которых она создавалась, пишет Pong Eksombatchai, инженер-программист в Pinterest. Обучиться практическим навыкам по МО можно на курсе по Machine Learning, который начнется 28 мая. Вас научат решать бизнес-задачи методами МО, курс подходит новичкам и не требует обширных знаний в программировании. Освоить профессию Data Scientist с нуля можно всего за 11 недель вместе с Александром Петровым, старшим инженером-разработчиком Amazon, который придерживается принципа: меньше теории, больше практики — и не даст вам заскучать на занятиях!

Выходит, разница еще и в том, что в отличие от программирования, с МО вам не нужно самостоятельно строить модель. Эта задача возлагается на алгоритмы МО, правки в которые может внести дата-инженер.

Также отличием является объем данных, который влияет на точность модели и подвергается значительным ограничениям в программировании, однако может быть использован во всей своей полноте в МО. Прибегая к МО, вы можете использовать столько параметров, сколько вам необходимо.

Что и сделали инженеры Pinterest для создания своей уникальной рекомендательной системы.

текст: Любицкая Дарья

Поделиться:
Опубликовано в рубрике Machine LearningTagged , ,

SkillFactory.Рассылка