Переобучение и недообучение 0:00 В видео обсуждаются понятия переобучения и недообучения в машинном обучении. Создаются синтетические данные для задачи регрессии, где обучающая выборка состоит из одного признака и целевой переменной.
Переобучение 1:53 Обучается модель дерева решений на обучающей выборке. На обучающей выборке среднектичная ошибка равна нулю, что говорит о переобучении. На тестовой выборке среднектичная ошибка больше, что говорит о недообучении.
Нормальное обучение 8:34 Обучается модель дерева решений с подходящими параметрами. На обучающей выборке среднектичная ошибка составляет 58, на тестовой выборке - 130. Это говорит о нормальном обучении, когда моделька улавливает общий смысл данных, но не начинает подгоняться под все выбросы и шумы.