в Анализ данных, Наука о данных (Data Science)

Введение в машинное обучение: люди и изобретения, способствовавшие его зарождению и развитию

Когда видишь заголовки статей о машинном обучении, кажется, что человечество только что сделало важное открытие. На самом деле, эта технология почти так же стара, как и необходимость в вычислениях. Этот материал — введение в машинное обучение. Вы узнаете, как оно зародилось и развивалось. Это поможет вам лучше понять, что это за технология.

Закладка фундамента в области машинного обучения (1642—1936 гг)

Введение в машинное обучение: закладка фундамента

Без этих мыслителей и мастеров не появились бы вычислительные машины, а тем более машинное обучение.

Хотите освоить машинное обучение и стать востребованным специалистом? Записывайтесь на очный курс «Практический Machine Learning».

1642 г. Юноша из Франции создает первый механический калькулятор. Его изобрел в 19 лет Блез Паскаль, чтобы облегчить работу отцу — сборщику налогов. Она может складывать, вычитать, умножать и делить.

Введение в машинное обучение: первый калькулятор

Суммирующая машина «Паскалина»

1679 г. Появляется современная двоичная система счисления. Немецкий математик, философ и языковед Готфрид Вильгельм Лейбниц разработал двоичную систему счисления, которая стала основой современных вычислительных машин.

1770 г. Появляется первый шахматный автомат, который дурачил Европу десятки лет. Механическое устройство под названием «Турок», которое обмануло самого Наполеона. Внутри прятался сильный шахматист и управлял шахматным автоматом. Со стороны казалось, что это чудо-машина, которая наделена разумом. Обман раскрылся только в 1857 году, когда последний владелец устройства показал, где прятался человек и как он управлял «Турком». Сегодня шахматная программа — уже не обман, а реальность. И заслуга в этом принадлежит машинному обучению.

Введение в машинное обучение: лже-устройство, умеющее играть в шахматы

«Турок» на гравюре современника. 1789 г

1834 г. «Отец компьютера» придумывает программируемую вычислительную машину. Чарлз Бэббидж начинает проектировать аналитическую машину. Он так и не успел ее построить. Тем не менее его задумка стала основой архитектуры современных компьютеров.

1842 г. Алгоритм Ады Лавлейс делает ее первым программистом в истории. В 27 лет Ада создала последовательность операций для решения математических задач на аналитической машине Чарлза Бэббиджа. В ее честь Министерство обороны США назвала язык программирования для встроенных систем.

1847 г. Элементарная алгебра определяет работу процессоров за сто лет до их изобретения. Математик и логик Джордж Буль создал раздел алгебры, в котором все значения сводятся к одному из двух понятий: истина (true) или ложь (false). В современных компьютерах алгебра логики помогает процессору решить, как обрабатывать данные.

1927 г. Искусственный интеллект дебютировал на экране. Фриц Ланг снимает немой научно-фантастический художественный фильм «Метрополис», в котором знакомит зрителя с идеей разумной машины. Лже-Мария, один из персонажей фильма, стала первым роботом, запечатленном на кинопленке.

1936 г. Алан Тьюринг придумывает абстрактную вычислительную машину (машину Тьюринга). Вдохновленный протекающими в человеке процессами при решении задач, английский математик, логик и криптограф Алан Тьюринг представил процесс, как машина может расшифровывать и исполнять инструкции. Этот труд вошел в основу информатики.

От задумки к воплощению машинного обучения (1943—1999 гг)

Введение в машинное обучение: как оно становилось реальностью

Эта часть введения в машинное обучение посвящена предметам, которые за полвека из фантастики превратились в реальность.

1943 г. Биологическая нейронная сеть представляется как электрическая цепь. В этом году была сформулирована теория того, как работают нейроны. Для иллюстрации нейронные сети изобразили в виде электрической цепи. В 1950-х годах ученые из области информатики стали применять эту теорию в своих работах.

1952 г. Компьютер научился самосовершенствоваться в игре «Шашки». Первопроходец в машинном обучении Артур Сэмюэл создал программу, которая помогала компьютеру IBM играть в шашки с каждой партией все лучше и лучше. Ученые из области машинного обучения часто используют настольные игры, потому что они понятные и комплексные.

1959 г. Искусственная нейронная сеть научилась удалять помехи во время телефонных разговоров. Искусственная нейронная сеть представляет собой подобие нервной системы человека. Первая нейронная сеть, которую использовали для решения реальной проблемы, стала MADALINE. Она с помощью адаптивного фильтра удаляла эхо-сигналы на телефонных линиях. Эта нейронная сеть используется по сей день.

1968 г. Кубрик задает высокую планку для искусственного интеллекта 2001 года. Когда Стэнли Кубрик снимал «Космическую одиссею 2001 года», то консультировался с Марвином Ли Минским, сооснователем Лаборатории искусственного интеллекта в Массачусетском технологическом институте. Он спросил его, возможно ли, что к 2001 году появятся компьютеры, обладающие интеллектом, как у человека, и способные различать эмоции. Минский ответил, что это возможно.

1979 г. Стэнфордская тележка катится медленно, но верно. В 1960 году студент Стэнфордского университета Джеймс Адамс решил избавиться от проблем, которые возникают при управлении луноходом с Земли. Для этого он оснастил тележку камерой и дистанционным управлением. Спустя двадцать лет стэнфордская тележка смогла передвигаться по комнате с препятствиями (не задевая их) без участия человека.

Введение в машинное обучение: стэнфордская тележка

Стэнфордская тележка

1985 г. NETtalk научилась выговаривать слова. Эта нейронная сеть, разработанная Терри Сейновски и Чарльзом Розенбергом, за неделю научилась правильно произносить 20 000 слов. Первые слова звучали как тарабарщина, но с тренировкой ее речь стала более ясной и похожей на человеческую.

1997 г. Deep Blue побеждает чемпиона мира по шахматам. Когда шахматный компьютер Deep Blue, разработанный компанией IBM, обыграл Гарри Каспарова, это был первый случай, когда компьютер оказался в шахматах лучше человека.

Введение в машинное обучение: программа, обыгравшая в шахматы Гарри Каспарова

Deep Blue

1999 г. Компьютерная диагностика выявляет рак лучше докторов. Компьютеры не могут излечить от рака, но могут его диагностировать. Рабочая система в САПР, разработанная Чикагским университетом, отсканировала 22 000 маммограмм и обнаружила рак на 52% точнее радиологов.

Современное машинное обучение (2006—2017 гг)

Введение в машинное обучение: оно перетекает в нашу жизнь

В этой части введения в машинное обучение рассказывается, как машинное обучение вышло из лабораторий и стало проникать в нашу жизнь через разные отрасли.

2006 г. Изучение нейронной сети перерастает в «глубокое обучение». Когда нейронные сети вышли из лабораторий и стали применяться в жизни, специалист в области информатики Джеффри Хинтон переименовал изучение нейронных сетей в глубокое обучение. Сегодня влиятельные лица интернета используют этот метод, чтобы улучшить программы по распознаванию голоса и разметки изображений.

2009 г. BellKor’s Pragmatic Chaos выигрывает 1 млн. долларов в конкурсе от Netflix. В 2006 году Netflix предложила 1 млн. долларов тому, кто улучшит алгоритмы рекомендательной системы Cinematch. Эта система предлагает клиентам новые фильмы, основываясь на их мнении о просмотренных ранее кинолентах. Победитель определился только через три года. Им оказалась команда BellKor’s Pragmatic Chaos. Улучшить алгоритмы сумела и команда Ensemble. Однако она отправила результаты на 20 минут позже команды BellKor’s Pragmatic Chaos, поэтому и не выиграла.

2011 г. Суперкомпьютер IBM Watson побеждает в телевикторине Jeopardy (российский аналог — Своя игра). IBM Watson удалось обыграть двух самых сильных участников телевикторины. В планах у IBM развить эту технологию, чтобы она могла стать автоматизированным ассистентом врача и помогала в диагностировании и лечении болезней.

2012 г. Google Brain распознает человеческие лица на картинках. Нейронная сеть научилась распознавать людей и кошек в роликах на YouTube. Лица она распознает с точностью 81.7%, а кошек — с точностью 74.8%.

Введение в машинное обучение: распознавание лиц

2014 г. Чатбот Женя Густман проходит тест Тьюринга. Он убеждает 33% экспертов в том, что является 13-летним мальчиком из Одессы.

Введение в машинное обучение: тест Тьюринга

Теста Тьюринга: эксперты пять минут переписываются одновременно с живым человеком и роботом, находясь в разных комнатах и не видя друг друга. Потом каждый эксперт говорит, кто был человеком, а кто — программой

Читайте в блоге: Что такое бот?

2014 г. Компьютеры помогают улучшить приемные отделения больниц. Здравоохранение начинает использовать машинное обучение, чтобы предсказать время ожидания в приемных отделениях, опираясь на данные: укомплектованность персонала больницы, истории болезней и план больницы. Такие прогнозы помогают больницам сокращать время ожидания приема.

2015 г. Машины и люди объединяются для борьбы с мошенничеством в интернете. Когда PayPal собрался бороться с мошенничеством и отмыванием денег через сервис, он применил смешанный подход. Детективы задают параметры преступного поведения, а машина с помощью этих параметров выявляет мошенников на сайте PayPal.

2016 г. Компьютер выигрывает у человека в самой сложной настольной игре. AlphaGo стала первой программой, которая сумела обыграть самого лучшего игрока в го — Ли Седоля. Теперь можно официально утверждать, что компьютеры смогли обыграть человека в каждой классической настольной игре.

Введение в машинное обучение: компьютер обыграл в го чемпиона мира

Матч AlphaGo — Ли Седоль

2016 г. Компьютер научился читать по губам. HAL 9000, вымышленный компьютер из «Космической одиссеи 2001 года», умел читать по губам. Команда из Оксфорда сумела создать нейросеть LipNet, которая распознает слова по движениям губ с точностью 93.4%. Таким образом она превратила научную фантастику в реальность.

2016 г. Обработка естественного языка дает жизнь цифровому персональному консультанту. North Face стала первым продавцом, которая использовала IBM Watson для обработки естественного языка в мобильном приложении. Цифровой персональный консультант общается с клиентами и помогает им найти нужную вещь. То есть с такой программой у компании отпадает необходимость держать продавцов-консультантов.

Введение в машинное обучение: цифровой персональный консультант

Цифровой персональный консультант в North Face

2017 г. Машина научилась пресекать онлайн-троллинг. Компания Jigsaw создала систему, которая научилась определять троллинг, прочитав миллион комментариев на сайте. Алгоритмы системы могут пригодится владельцам сайтов, у которых не хватает ресурсов на модерацию.

Что дальше ожидать от машинного обучения

На этом мы заканчиваем введение в машинное обучение. Точно не скажем, куда и насколько продвинется технология, — это покажет время. Однако уже сейчас заметно, что она пробралась почти во все сферы нашей жизни. Она помогает увеличивать продажи, повышает безопасность с помощью биометрических данных, предсказывает и диагностирует болезни и делает много чего еще.

Перевод статьи A history of machine learning.

Поделиться: