Содержание курса
1. Введение
2 урока
29
15
237м
0
Закрытый
1.1
Добро пожаловать
↗
16
2
236м 10с
0
Закрытый
1.2
Важно
↗
13
13
1м 11с
0
2. Окружение: Docker-стенд, проверка сервисов
5 уроков
52
25
15м
0
Закрытый
2.1
Как проходить практикум через Stepik + Git
↗
13
13
1м 46с
0
Закрытый
2.2
Как устроен практикум и репозиторий
↗
12
6
9м 4с
0
Закрытый
2.3
Установка инструментов
↗
12
3
5м 42с
0
Закрытый
2.4
Репозиторий и правила работы с файлами
↗
7
2
-
0
Закрытый
2.5
Первый запуск стенда и проверка сервисов
↗
8
1
-
0
3. RAW → STG: загрузка датасетов, идемпотентность
4 урока
4
4
0м
0
Закрытый
3.1
RAW и ingest_date
↗
2
2
-
0
Закрытый
3.2
Загрузка orders в STG через replace-by-date
↗
1
1
-
0
Закрытый
3.3
order_items и проверки связности
↗
1
1
-
0
Закрытый
3.4
Остальные таблицы и проверка идемпотентности
↗
0
0
-
0
4. Моделирование CORE: факты/измерения, event-даты, инкременты
5 уроков
0
0
0м
0
Закрытый
4.1
Зачем нужен CORE и что такое факт/измерения
↗
0
0
-
0
Закрытый
4.2
Первые измерения CORE и полный загрузочный прогон (SCD1)
↗
0
0
-
0
Закрытый
4.3
core.dim_customer как SCD2: история адресов клиента
↗
0
0
-
0
Закрытый
4.4
Первый факт CORE: core.fct_order_items
↗
0
0
-
0
Закрытый
4.5
Data Quality в CORE: что проверить в фактах и измерениях
↗
0
0
-
0
5. Основы Spark
1 урок
0
0
0м
0
Закрытый
5.1
В разработке
↗
0
0
-
0
6. Витрины: денормализация, партиционирование
1 урок
0
0
0м
0
Закрытый
6.1
В разработке
↗
0
0
-
0
7. Качество и SLA: дубликаты, пропуски, аномалии
1 урок
0
0
0м
0
Закрытый
7.1
В разработке
↗
0
0
-
0
8. Spark Batch: трансформации, партиционирование, оптимизация
1 урок
0
0
0м
0
Закрытый
8.1
В разработке
↗
0
0
-
0
9. Оркестрация (Airflow): DAG raw→stg→core→marts
1 урок
0
0
0м
0
Закрытый
9.1
В разработке
↗
0
0
-
0
10. Метрики пайплайнов, алерты
1 урок
0
0
0м
0
Закрытый
10.1
В разработке
↗
0
0
-
0
11. SQL-оптимизация: планы, индексы, анти-паттерны
1 урок
0
0
0м
0
Закрытый
11.1
В разработке
↗
0
0
-
0