Чему вы научитесь
- Поднимать локальный стенд: Spark + Postgres + Airflow + JupyterLab + MinIO в Docker
- Понимать, что за что отвечает в окружении, и разбирать типовые проблемы по логам
- Организовывать слои RAW / STG / CORE / MARTS на реальном датасете
- Делать идемпотентные и инкрементальные загрузки
- Проектировать факты, измерения, event-даты и витрины
- Писать базовые SQL- и Spark-трансформации для подготовки слоёв
- Оформлять пайплайн в Airflow DAG: зависимости, ретраи, расписание
- Делать DQ-проверки: дубли, пустые ключи, расхождения по слоям
- Собирать финальную витрину и простой BI-дашборд
- Оформлять результат в Git-репозитории и уверенно рассказывать про свой ETL-проект на собеседовании
О курсе
Для кого этот курс
Для кого этот курс
Практикум подойдёт: Аналитикам и BI-специалистам, которые хотят перейти в Data Engineering не через абстрактные лекции, а через реальный проект; Junior DE и backend-разработчикам, которым не хватает цельной практики: DWH, Spark, Airflow, витрины и BI; Тем, у кого уже есть рабочий SQL и кто хочет не просто смотреть уроки, а собрать руками ETL-пайплайн и получить сильный кейс для портфолио.Начальные требования
уверенная база по SQL: SELECT, JOIN, GROUP BY, базовые агрегаты, CTE
понимание, что такое факты, измерения и слои данных на уровне идей
базовое знакомство с Python: читать код, править простые функции, не бояться списков и словарей
готовность поставить Docker по инструкции и немного разбираться с окружением
желание не просто “запустить ноутбук”, а понять логику и архитектуру пайплайна
Преподаватели курса
Как проходит обучение
Вы проходите практикум в своём темпе, без созвонов и видео-марафонов.
Сначала заполняете диагностику и пишете мне в Telegram. После подтверждения получаете доступ к приватному GitHub-репозиторию и инструкции по запуску стенда.
Дальше поднимаете локальное окружение у себя на машине, проходите модули по шагам и собираете проект: SQL, Spark, Docker, Airflow, DWH, BI.
По ходу задаёте вопросы в чате. Я помогаю с окружением, логами, ошибками в коде и ключевыми решениями по пайплайну.
Рекомендованный темп — 6-8 часов в неделю.
Что вы получите
- цельный проект для портфолио: mini-DWH + сквозной ETL + витрина + BI-дашборд
- навык поднятия локального DE-стенда без магии и страха перед Docker
- понимание, как устроены RAW / STG / CORE / MARTS, инкременты, DAG и DQ-проверки
- опыт работы с Git и приватным репозиторием как в реальной команде
- поддержку на первых шагах: разбор логов, ошибок, архитектурных решений
- материалы и репозиторий, к которым можно возвращаться позже, когда будете собирать свой следующий пайплайн