Обучение на размеченных данных или обучение с учителем – это наиболее распространенный класс задач машинного обучения. К нему относятся те задачи, где нужно научиться предсказывать некоторую величину для любого объекта, имея конечное число примеров. Это может быть предсказание уровня пробок на участке дороги, определение возраста пользователя по его действиям в интернете, предсказание цены, по которой будет куплена подержанная машина.
В этом курсе вы научитесь формулировать и, конечно, решать такие задачи. В центре нашего внимания будут успешно применяемые на практике алгоритмы классификации и регрессии: линейные модели, нейронные сети, решающие деревья и так далее. Особый акцент мы сделаем на такой мощной технике как построение композиций, которая позволяет существенно повысить качество отдельных алгоритмов и широко используется при решении прикладных задач. В частности, мы узнаем про случайные леса и про метод градиентного бустинга.
Построение предсказывающих алгоритмов — это лишь часть работы при решении задачи анализа данных. Мы разберемся и с другими этапами: оценивание обобщающей способности алгоритмов, подбор параметров модели, выбор и подсчет метрик качества.
Неделя 1 Машинное обучение и линейные модели
- Знакомство с машинным обучением
- Линейные модели
- Assignment Линейная регрессия и основные библиотеки Python
- Assignment Линейная регрессия и стохастический градиентный спуск
Неделя 2 Борьба с переобучением и оценка качества
- Проблема переобучения и борьба с ней
- Метрики качества
- Библиотека sklearn. Введение
- Assignment Линейная регрессия: переобучение и регуляризация
- Assignment Сравнение метрик качества бинарной классификации
Неделя 3 Линейные модели: классификация и практические аспекты
- Линейные модели: статистический взгляд
- Практические рекомендации по линейным моделям
- Библиотека scikit-learn. Продолжение.
- Assignment Предобработка данных и логистическая регрессия
Неделя 4 Решающие деревья и композиции алгоритмов
- Решающие деревья
- Случайные леса
- Assignment Бэггинг и случайный лес
- Градиентный бустинг
- Assignment Градиентный бустинг своими руками
Неделя 5 Нейронные сети и обзор методов
- Нейронные сети
- Assignment Нейронные сети
- Байесовская классификация и регрессия
- Assignment Выбор семейства распределений в наивном байесе
- Метрические алгоритмы и SVM
- Assignment 1NN против RandomForest
- Теорема Байеса в машинном обучении
- Рекомендации книг от авторов курса
- Пример задачи: sentiment analysis данных IMDb