Фишки AutoML – Денис Воротынцев

YOUTUBE · 26.11.2025 04:40

Ключевые темы и таймкоды

Введение в автомель

0:00
  • Денис Воротынцев, сеньор дата-сайнс в компании Оура, рассказывает о своем опыте работы с автомелем, коробочным решением для машинного обучения.
  • Автомель позволяет автоматизировать процесс моделирования, что экономит время и позволяет сосредоточиться на более важных задачах.

Примеры использования автомеля

1:37
  • Денис приводит примеры использования автомеля на практике, используя библиотеку аш два о и типот.
  • Он также рассказывает о своем опыте участия в соревнованиях по машинному обучению, где автомель занял второе-восьмое место.

Бамбарк на автомель

6:22
  • Денис проводит собственный бамбарк на автомель, сравнивая его результаты с результатами человека.
  • Он отмечает, что автомель не всегда показывает хорошие результаты, и его скоро не растет с увеличением времени тренировки.

Автоматическое извлечение признаков

8:33
  • Видео обсуждает использование библиотек для автоматического извлечения признаков из данных.
  • Рассматриваются три библиотеки: Feature Tools, Category Coding и TF-Fresh.
  • Feature Tools позволяет агрегировать данные из нескольких таблиц, а Category Coding предлагает различные типы кодировщиков для категориальных данных.
  • TF-Fresh оптимизирует процесс извлечения признаков на основе временных рядов.

Оптимизация выбора признаков

12:33
  • Обсуждается использование корреляции и других методов для выбора признаков.
  • Рассматривается использование генетических алгоритмов для оптимизации выбора признаков.
  • Генетические алгоритмы позволяют перебирать различные комбинации признаков и выбирать те, которые дают наилучшие результаты.
  • В видео также упоминается возможность использования этих методов для стакинга результатов и участия в соревнованиях по машинному обучению.

Оптимизация алгоритмов машинного обучения

15:29
  • Видео обсуждает процесс оптимизации алгоритмов машинного обучения, включая выбор фичей и настройку гиперпараметров.
  • Автор упоминает, что оптимизация может занять много времени, особенно если сравнивать с библиотекой Hiperopt.
  • Он также рекомендует использовать библиотеку для моделей, которые быстро обучаются или для тренировки на субсете данных.

Мета-обучение и обучение на субсетках

17:29
  • Мета-обучение - это использование предыдущих задач для оптимизации новых задач.
  • Автор рекомендует использовать веб-сайт Open AI для поиска похожих задач и использования их параметров для оптимизации новых задач.
  • Обучение на субсетках - это разбиение данных на части для обучения моделей, что позволяет обучать больше моделей за меньшее время.
  • Автор подчеркивает важность фиксации сида для обучения на субсетках, чтобы результаты были сопоставимы.