Введение и теоретический вопрос 0:00 Автор пришел на собеседование в Сбер на позицию дата-сайентиста. Видео короткое, чтобы дать максимум информации за короткое время. Теоретический вопрос: стратегия перебрасывания кубика для максимизации выигрыша.
Формальные вопросы и алгоритмы классификации 0:59 Определение декоратора и итератора. Различие между итератором и генератором. Алгоритмы классификации: KNN, регрессия, деревья, бустинг, случайный лес, нейронные сети.
Стратегии работы с признаками и регуляризация 2:54 Стратегии работы с признаками: понижение размерности и отбор признаков. Методы отбора признаков: регуляризация. Виды регуляризации: L1 и L2.
Задачи и инструменты для работы с данными 3:54 Решение задачи с таблицами. Любимый инструмент для работы с данными: Pandas. Задача по прогнозированию топ-20 товаров для пользователя.
Оценка рекомендательной системы 5:52 Оценка качества рекомендательной системы. Офлайновые и онлайновые метрики. Точность предсказания и конвертация в TF-IDF.
Заключение и приглашение на финальный этап 7:50 Автор прошел собеседование и приглашен на финальный этап. Призыв к зрителям ставить лайки и писать комментарии.