Введение в машинное обучение: люди и изобретения, способствовавшие его зарождению и развитию в IT

машинное обучение

Когда видишь в поиске Яндекса или, например, в Google множество заголовков статей о машинном обучении, кажется, что человечество только что сделало важное открытие. На самом деле, эта технология почти так же стара, как и необходимость в вычислениях. Этот материал — введение в машинное обучение (Machine Learning, ML). Вы узнаете его цель и модели применения, как оно зародилось и развивалось. Это поможет вам лучше понять базовый принцип, что это за технология и что конкретно за ней стоит.

Определение фундамента в области машинного обучения (1642—1936 гг)

Введение в машинное обучение: закладка фундамента

Без этих мыслителей, мастеров и их огромного вклада в исследования в области автоматизации было бы невозможно наше будущее, не появились бы эффективные вычислительные машины, а тем более машинное обучение.

Хотите освоить машинное обучение и стать востребованным специалистом? Записывайтесь на «Курс по Machine Learning».

[course id=1062]

1642 г. Юноша из Франции создает первый механический калькулятор. Его изобрел в 19 лет Блез Паскаль, чтобы попробовать облегчить работу отцу, которому приходилось собирать налоги по роду деятельности. Она может складывать, вычитать, умножать и делить.

Введение в машинное обучение: первый калькулятор
Суммирующая машина «Паскалина»

1679 г. Появляется современная двоичная система счисления. Немецкий математик, философ и языковед Готфрид Вильгельм Лейбниц разработал двоичную систему счисления, которая стала основой современных вычислительных машин, альтернативной базой любого компьютера.

1770 г. Появляется первый шахматный автомат, который дурачил Европу десятки лет. Механическое устройство под названием «Турок», которое пыталось обмануть самого Наполеона, и у него это получилось. Внутри прятался сильный шахматист и управлял шахматным автоматом. Со стороны казалось, что это чудо-машина, которая наделена разумом. Обман раскрылся только в 1857 году, когда последний владелец устройства показал, где прятался человек и как он управлял «Турком». Сегодня шахматная программа — уже не обман, а реальность. И явная заслуга в этом принадлежит машинному обучению. Логика современных компьютерных программ по крупицам состоит из исторически важных открытий предыдущих столетий.

Введение в машинное обучение: лже-устройство, умеющее играть в шахматы
«Турок» на гравюре современника. 1789 г

1834 г. «Отец компьютера» придумывает программируемую вычислительную машину. Чарлз Бэббидж начинает проектировать аналитическую машину. Он так и не успел ее построить. Тем не менее его задумка содержит основы архитектуры современных компьютеров.

1842 г. Алгоритм Ады Лавлейс делает ее первым программистом в истории. В 27 лет Ада создала последовательность операций для решения математических задач на аналитической машине Чарлза Бэббиджа. В ее честь Министерство обороны США назвала язык программирования для встроенных систем.

1847 г. Элементарная алгебра определяет работу процессоров за сто лет до их изобретения. Математик и логик Джордж Буль создал раздел алгебры, в котором все значения сводятся к одному из двух понятий: истина (true) или ложь (false). В современных компьютерах алгебра логики помогает процессору решить, как точно собирать и обрабатывать данные показатели.

1927 г. Искусственный интеллект дебютировал на экране. Фриц Ланг снимает немой научно-фантастический художественный фильм «Метрополис», в котором знакомит зрителя с идеей разумной машины. Лже-Мария, один из персонажей фильма, стала первым роботом-помощником, запечатленном на кинопленке.

1936 г. Алан Тьюринг придумывает абстрактную вычислительную машину (машину Тьюринга). Вдохновленный протекающими в человеке процессами при решении задач, английский математик, логик и криптограф Алан Тьюринг представил процесс, как машина может расшифровывать и исполнять инструкции. Пример его труда вошел в основу информатики.

[course id=1046]

От простой задумки к воплощению машинного обучения (1943—1999 гг)

Введение в машинное обучение: как оно становилось реальностью

Эта часть введения в машинное обучение посвящена предметам и инструментам, которые за полвека из фантастики превратились в реальность.

1943 г. Биологическая нейронная сеть представляется как электрическая цепь. В этом году была сформулирована теория того, по какому правилу работают нейроны. Для иллюстрации нейронные сети изобразили в виде электрической цепи. В 1950-х годах ученые из области информатики стали применять эту теорию в своих работах.

1952 г. Компьютер научился самосовершенствоваться в игре «Шашки». Первопроходец в машинном обучении Артур Сэмюэл создал программу, которая помогала компьютеру IBM играть в шашки с каждой партией все лучше и лучше, обучаться на своих ошибках. Ученые из области машинного обучения часто используют настольные игры, потому что они понятные и комплексные.

1959 г. Искусственная нейронная сеть научилась удалять помехи во время телефонных разговоров. Искусственная нейронная сеть представляет собой подобие нервной системы человека. Первая нейронная сеть, которую использовали для решения реальной проблемы, стала MADALINE. Она с помощью адаптивного фильтра удаляла эхо-сигналы на телефонных линиях. Эта нейронная сеть существует и продолжает использоваться по сей день.

1968 г. Кубрик задает высокую планку для построения искусственного интеллекта 2001 года. Когда Стэнли Кубрик снимал «Космическую одиссею 2001 года», то консультировался с Марвином Ли Минским, сооснователем Лаборатории искусственного интеллекта в Массачусетском технологическом институте. Он спросил его, возможно ли, что к 2001 году появятся компьютеры, обладающие интеллектом, как у человека, и способные учиться и различать эмоции. Минский ответил, что это возможно.

1979 г. Стэнфордская тележка катится медленно, но верно. В 1960 году студент Стэнфордского университета Джеймс Адамс принял оптимальное решение избавиться от проблем, которые возникают при управлении луноходом с Земли. Для этого он оснастил тележку камерой и дистанционным управлением. Спустя двадцать лет стэнфордская тележка смогла передвигаться по комнате с препятствиями (не задевая их) без участия человека.

Введение в машинное обучение: стэнфордская тележка
Стэнфордская тележка

1985 г. NETtalk научилась выговаривать слова. Эта нейронная сеть, разработанная Терри Сейновски и Чарльзом Розенбергом, за неделю научилась правильно произносить 20 000 слов. Первые слова звучали как тарабарщина, но с тренировкой ее речь стала более ясной и сходной с человеческой.

1997 г. Deep Blue побеждает чемпиона мира по шахматам. Когда шахматный компьютер Deep Blue, разработанный компанией IBM, обыграл Гарри Каспарова, это был первый случай, когда функционально компьютер оказался в шахматах лучше человека.

Введение в машинное обучение: программа, обыгравшая в шахматы Гарри Каспарова
Deep Blue

1999 г. Компьютерная диагностика выявляет рак лучше докторов. Компьютеры не могут излечить от рака, но могут его диагностировать. Рабочая система в САПР, разработанная Чикагским университетом, отсканировала 22 000 маммограмм и обнаружила рак на 52% точнее радиологов.

[course id=1073]

Современное машинное обучение (2006—2017 гг)

Введение в машинное обучение: оно перетекает в нашу жизнь

В этой части введения в машинное обучение рассказывается, как машинное обучение вышло из лабораторий и стало проникать в нашу жизнь через различные отрасли.

2006 г. Изучение нейронной сети перерастает в «глубокое обучение». Когда нейронные сети вышли из лабораторий и стали применяться в жизни, специалист в области информатики Джеффри Хинтон переименовал изучение нейронных сетей в глубокое обучение. Сегодня влиятельные лица интернета используют этот метод и накопленный годами опыт, чтобы улучшить программы по совокупному распознаванию голоса и разметки изображений и снимков.

2009 г. BellKor’s Pragmatic Chaos выигрывает 1 млн. долларов в конкурсе от Netflix. В 2006 году Netflix предложила 1 млн. долларов тому, кто улучшит алгоритмы рекомендательной системы Cinematch. Эта система предлагает клиентам новые фильмы, основываясь на их мнении о просмотренных ранее кинолентах. Победитель определился только через три года. Им оказалась команда BellKor’s Pragmatic Chaos. Улучшить алгоритмы сумела и команда Ensemble. Однако она отправила результаты на 20 минут позже команды BellKor’s Pragmatic Chaos, поэтому не выполнила условие и не выиграла.

2011 г. Суперкомпьютер IBM Watson побеждает в телевикторине Jeopardy (российский аналог — Своя игра). IBM Watson удалось обыграть двух самых сильных участников телевикторины. В планах у IBM развить эту технологию, чтобы она могла стать автоматизированным ассистентом врача и помогала в диагностировании и технике лечении болезней.

2012 г. Google Brain распознает человеческие лица на картинках. Нейронная сеть научилась распознавать людей и кошек в роликах на YouTube. Как показала практика, лица она распознает с точностью 81.7%, а кошек — с точностью 74.8%.

Введение в машинное обучение: распознавание лиц

2014 г. Чатбот Женя Густман проходит тест Тьюринга. Он убеждает 33% экспертов в том, что является 13-летним мальчиком из Одессы.

Введение в машинное обучение: тест Тьюринга
Теста Тьюринга: эксперты пять минут переписываются одновременно с живым человеком и роботом, находясь в разных комнатах и не видя друг друга. Потом каждый эксперт говорит, кто был человеком, а кто — программой
Читайте в блоге: Что такое бот?

[read id=817]

2014 г. Компьютеры помогают улучшить приемные отделения больниц. Здравоохранение начинает использовать машинное обучение, чтобы предсказать время ожидания в приемных отделениях, опираясь на условные данные: укомплектованность персонала больницы, истории болезней и план больницы. Такие прогнозы помогают больницам оценивать и сокращать время ожидания приема.

2015 г. Машины и люди объединяются для борьбы с мошенничеством в интернете. Когда PayPal собрался бороться с мошенничеством и отмыванием денег через сервис, он применил определенный смешанный подход. Детективы задают параметры преступного поведения, а машина с помощью этих параметров выявляет мошенников на сайте PayPal.

2016 г. Компьютер выигрывает у человека в самой сложной настольной игре. AlphaGo стала первой программой, которая сумела обыграть самого лучшего игрока в го — Ли Седоля. Теперь можно официально утверждать, что компьютеры смогли обыграть профессионального игрока в каждой классической настольной игре.

Введение в машинное обучение: компьютер обыграл в го чемпиона мира
Матч AlphaGo — Ли Седоль

2016 г. Компьютер научился читать по губам. HAL 9000, вымышленный компьютер из «Космической одиссеи 2001 года», умел читать по губам. Команда из Оксфорда сумела создать нейросеть LipNet, которая распознает слова по движениям губ с точностью 93.4%. Таким образом эта платформа превратила научную фантастику в реальность.

2016 г. Обработка естественного языка дает жизнь цифровому персональному консультанту. North Face стала первым продавцом, которая использовала IBM Watson для обработки естественного языка в мобильном приложении. Цифровой персональный консультант общается с клиентами и делает им предложение нужной вещи. То есть с такой программой у компании отпадает необходимость держать продавцов-консультантов.

Введение в машинное обучение: цифровой персональный консультант
Цифровой персональный консультант в North Face

2017 г. Машина научилась пресекать онлайн-троллинг. Компания Jigsaw создала систему, которая самостоятельно научилась определять троллинг, прочитав миллион комментариев на сайте и сравнив их. Алгоритмы системы могут пригодится владельцам сайтов, у которых не хватает ресурсов на модерацию и оптимизацию.

[read id=552]

Что дальше ожидать от машинного обучения

На этом мы заканчиваем введение в науку о машинном обучении. Точно не скажем, куда и насколько продвинется технология, — это покажет время. Однако отметим, что уже сейчас сразу видно, что она связана практически со всеми сферами нашей жизни. Она позволяет увеличивать продажи, повышает безопасность с помощью биометрических данных, предсказывает и диагностирует болезни и делает много чего еще.

Перевод статьи A history of machine learning.

Курс по Machine Learning

Курс по нейронным сетям и deep learning совместно с NVIDIA

Курс по Python для анализа данных

(рейтинг: 5, голосов: 1)
Добавить комментарий