Содержание курса
1. Введение в соревновательный Data Science
4 урока
12
10
0м
0
Закрытый
1.1
Kaggle. Что это и зачем?
↗
3
3
-
0
Закрытый
1.2
Структура соревнований: от постановки до последнего сабмита
↗
3
3
-
0
Закрытый
1.3
Основные метрики и их особенности (LogLoss, RMSE, F1, AUC, ...)
↗
3
2
-
0
Закрытый
1.4
Data Leaks
↗
3
2
-
0
2. Продвинутый EDA и Feature Engineering
4 урока
8
8
0м
0
Закрытый
2.1
Автоматизация EDA: инструменты и библиотеки
↗
2
2
-
0
Закрытый
2.2
Работа с пропущенными значениями и выбросами.
↗
2
2
-
0
Закрытый
2.3
Создание новых признаков: время, категории, текст и геоданные
↗
2
2
-
0
Закрытый
2.4
Методы отбора признаков: корреляция, важность признаков, shap
↗
2
2
-
0
3. Оптимизация моделей и гиперпараметров
3 урока
4
4
0м
0
Закрытый
3.1
Обзор методов оптимизации: Grid Search, Random Search, Bayesian
↗
2
2
-
0
Закрытый
3.2
Использование Optuna для автоматизации подбора гиперпараметров
↗
1
1
-
0
Закрытый
3.3
Кросс-валидация: стратегии для маленьких и больших датасетов
↗
1
1
-
0
4. Отбор фичей
1 урок
0
0
0м
0
Закрытый
4.1
Отбор фичей
↗
0
0
-
0
5. Ансамбли моделей
3 урока
5
5
0м
0
Закрытый
5.1
Основы ансамблирования: бэггинг, бустинг, стекинг, блендинг.
↗
2
2
-
0
Закрытый
5.2
Популярные библиотеки: XGBoost, LightGBM, CatBoost.
↗
2
2
-
0
Закрытый
5.3
Создание собственных ансамблей.
↗
1
1
-
0
6. Работа с несбалансированными данными
2 урока
2
2
0м
0
Закрытый
6.1
Методы борьбы с дисбалансом классов: oversampling, undersampling
↗
1
1
-
0
Закрытый
6.2
Постобработка предсказаний: калибровка вероятностей и подбор пор
↗
1
1
-
0
7. Нейронные сети и трансформеры в табличных данных
2 урока
0
0
0м
0
Закрытый
7.1
Применение нейронных сетей для табличных данных (TabNet, LSTM)
↗
0
0
-
0
Закрытый
7.2
Использование предобученных моделей (BERT, GPT) для текстовых пр
↗
0
0
-
0
8. AutoML — автоматизация машинного обучения
5 уроков
0
0
0м
0
Закрытый
8.1
Введение в AutoML
↗
0
0
-
0
Закрытый
8.2
AutoML для классических задач
↗
0
0
-
0
Закрытый
8.3
AutoML для ансамблирования
↗
0
0
-
0
Закрытый
8.4
AutoML для работы с текстами и изображениями
↗
0
0
-
0
Закрытый
8.5
AutoML в соревнованиях
↗
0
0
-
0