Чему вы научитесь
- Формулировать ML-задачу из бизнес-требований: выбирать таргет, тип задачи, метрики и trade-offs.
- Проводить EDA, находить аномалии, пропуски, data leakage и временные утечки.
- Строить и валидировать признаки: кодирование, нормализация, обработка пропусков, feature selection и feature pipeline.
- Обучать baseline- и gradient boosting-модели, выбирать схему валидации и корректно интерпретировать результаты.
- Организовывать experiment tracking, сравнивать эксперименты и выбирать модель-кандидат на продакшн.
- Проводить error analysis: confusion matrix, сегментация ошибок, анализ сложных примеров и планирование следующих итераций.
- Упаковывать модель и признаки для inference, проектировать API-контракт и собирать сервис предсказаний на FastAPI.
- Встраивать ML-проект в инженерный контур: тесты, CI/CD, сборка артефактов и релизные проверки качества.
- Настраивать мониторинг latency, ошибок, data drift, prediction drift и деградации модели после релиза.
- Объяснять результаты, ограничения и trade-offs модели бизнесу, продукту и инженерной команде.
О курсе
Для кого этот курс
Начальные требования
Для комфортного прохождения курса желательно:
— уверенно писать на Python;
— уметь работать с Jupyter Notebook;
— знать основы pandas и NumPy;
Курс не рассчитан на полный старт с нуля в Python и математике. Если Вы уже умеете работать с данными и знакомы с базовым ML, курс поможет перейти к более прикладному и production-oriented уровню.
Преподаватели курса
Как проходит обучение
Обучение построено как последовательный проход по полному циклу Data Science-проекта.
Внутри курса Вас ждут теоретические объяснения, практические примеры и задания, в которых нужно будет формулировать ML-задачу, анализировать данные, строить признаки, обучать и оценивать модели, разбирать ошибки, собирать inference API, добавлять тесты, настраивать CI/CD и мониторинг.
По мере прохождения курса Вы будете двигаться от постановки задачи и EDA к обучению модели, затем к деплою, проверкам качества и поддержке модели после релиза. Такой формат помогает увидеть Data Science не как набор разрозненных техник, а как цельный инженерный процесс.
Что вы получите
- Полный прикладной пайплайн Data Science: от постановки ML-задачи и работы с данными до inference API, CI/CD и мониторинга модели в продакшне.
- Практические навыки, которые редко собирают в одном курсе: data leakage, feature engineering, experiment tracking, error analysis, quality gates, data drift и prediction drift.
- Понимание того, как доводить ML-решение до рабочего продакшн-сценария, а не оставлять его на уровне ноутбука.
- Практику на реальных для индустрии сценариях: обучение моделей, анализ ошибок, упаковка сервиса предсказаний, автоматические проверки и мониторинг после релиза.
- Системное представление о работе дата-сайентиста в реальном проекте: метрики, trade-offs, SLA, ограничения модели и взаимодействие с бизнесом и инженерами.
- Навыки, которые можно использовать в работе, pet-проектах и портфолио.