Курс 2 "Обучение на размеченных данных"

Обучение на размеченных данных или обучение с учителем – это наиболее распространенный класс задач машинного обучения. К нему относятся те задачи, где нужно научиться предсказывать некоторую величину для любого объекта, имея конечное число примеров. Это может быть предсказание уровня пробок на участке дороги, определение возраста пользователя по его действиям в интернете, предсказание цены, по которой будет куплена подержанная машина.

В этом курсе вы научитесь формулировать и, конечно, решать такие задачи. В центре нашего внимания будут успешно применяемые на практике алгоритмы классификации и регрессии: линейные модели, нейронные сети, решающие деревья и так далее. Особый акцент мы сделаем на такой мощной технике как построение композиций, которая позволяет существенно повысить качество отдельных алгоритмов и широко используется при решении прикладных задач. В частности, мы узнаем про случайные леса и про метод градиентного бустинга.

Построение предсказывающих алгоритмов — это лишь часть работы при решении задачи анализа данных. Мы разберемся и с другими этапами: оценивание обобщающей способности алгоритмов, подбор параметров модели, выбор и подсчет метрик качества.

Неделя 1 Машинное обучение и линейные модели

Знакомство с машинным обучением
Линейные модели
Assignment Линейная регрессия и основные библиотеки Python
Assignment Линейная регрессия и стохастический градиентный спуск

Неделя 2 Борьба с переобучением и оценка качества

Проблема переобучения и борьба с ней
Метрики качества
Библиотека sklearn. Введение
Assignment Линейная регрессия: переобучение и регуляризация
Assignment Сравнение метрик качества бинарной классификации

Неделя 3 Линейные модели: классификация и практические аспекты

Линейные модели: статистический взгляд
Практические рекомендации по линейным моделям
Библиотека scikit-learn. Продолжение.
Assignment Предобработка данных и логистическая регрессия

Неделя 4 Решающие деревья и композиции алгоритмов

Решающие деревья
Случайные леса
Assignment Бэггинг и случайный лес
Градиентный бустинг
Assignment Градиентный бустинг своими руками

Неделя 5 Нейронные сети и обзор методов

Нейронные сети
Assignment Нейронные сети
Байесовская классификация и регрессия
Assignment Выбор семейства распределений в наивном байесе
Метрические алгоритмы и SVM
Assignment 1NN против RandomForest
Теорема Байеса в машинном обучении

Бонус

Рекомендации книг от авторов курса
Пример задачи: sentiment analysis данных IMDb

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

Курс 2 "Обучение на размеченных данных"

Неделя 1 Машинное обучение и линейные модели

Неделя 2 Борьба с переобучением и оценка качества

Неделя 3 Линейные модели: классификация и практические аспекты

Неделя 4 Решающие деревья и композиции алгоритмов

Неделя 5 Нейронные сети и обзор методов

Бонус

Files

README.md

Latest commit

History

README.md

File metadata and controls

Курс 2 "Обучение на размеченных данных"

Неделя 1 Машинное обучение и линейные модели

Неделя 2 Борьба с переобучением и оценка качества

Неделя 3 Линейные модели: классификация и практические аспекты

Неделя 4 Решающие деревья и композиции алгоритмов

Неделя 5 Нейронные сети и обзор методов

Бонус