Содержание курса
1. Основы архитектуры данных
8 уроков
770
412
68м
0
Открытый
1.1
Роль архитектора данных в системе
↗
259
69
8м 24с
0
Открытый
1.2
Архитектурные уровни данных
↗
91
61
8м 21с
0
Открытый
1.3
Типы архитектур — Data Warehouse, Data Lake, Lakehouse
↗
93
57
8м 8с
0
Открытый
1.4
Принципы построения архитектуры данных
↗
77
51
9м 59с
0
Открытый
1.5
Качество, консистентность и целостность данных
↗
72
49
9м 45с
0
Открытый
1.6
Метаданные и контракты данных
↗
62
43
10м 26с
0
Открытый
1.7
Потоки данных и Data Lineage
↗
60
42
7м 31с
0
Открытый
1.8
Компоненты современной экосистемы данных
↗
56
40
8м 15с
0
2. Моделирование данных
8 уроков
392
289
72м
0
Открытый
2.1
Концептуальное, логическое и физическое моделирование
↗
52
37
16м 28с
0
Открытый
2.2
ER-модели и нормализация данных
↗
51
37
7м 36с
0
Открытый
2.3
Денормализация и компромиссы производительности
↗
45
38
10м 34с
0
Открытый
2.4
Модели Star Schema и Snowflake
↗
62
39
7м 51с
0
Открытый
2.5
Data Vault и его применение
↗
51
35
11м 58с
0
Открытый
2.6
Семантические слои и представления данных
↗
48
37
7м 40с
0
Открытый
2.7
Документирование моделей (ERD, схемы, словари данных)
↗
44
33
6м 25с
0
Открытый
2.8
Управление изменениями моделей данных
↗
39
33
9м 47с
0
3. Хранилища данных и Lakehouse-архитектура
8 уроков
371
219
32м
0
Открытый
3.1
Архитектура классического Data Warehouse
↗
63
30
1м 0с
0
Открытый
3.2
Принципы построения Data Lake
↗
43
29
4м 24с
0
Открытый
3.3
Lakehouse: объединение хранилища и озера
↗
41
26
6м 23с
0
Открытый
3.4
Хранение сырых и обработанных данных
↗
40
26
2м 7с
0
Открытый
3.5
Партиционирование и оптимизация запросов
↗
48
27
5м 56с
0
Открытый
3.6
Delta Lake и Iceberg
↗
47
26
8м 25с
0
Открытый
3.7
Организация ETL/ELT-слоёв в Lakehouse
↗
47
28
1м 2с
0
Открытый
3.8
Архитектура аналитической платформы
↗
42
27
4м 12с
0
4. Интеграция и потоковая обработка данных
8 уроков
313
185
18м
0
Открытый
4.1
Источники и приёмники данных
↗
42
26
2м 42с
0
Открытый
4.2
Архитектура ETL и ELT
↗
49
26
1м 44с
0
Открытый
4.3
Очереди сообщений и брокеры (Kafka, RabbitMQ)
↗
43
25
1м 17с
0
Открытый
4.4
Потоковая обработка: Spark Streaming, Flink
↗
38
24
6м 35с
0
Открытый
4.5
Паттерны обработки событий и изменений (CDC)
↗
33
22
1м 40с
0
Открытый
4.6
Очередность и идемпотентность данных
↗
32
21
2м 10с
0
Открытый
4.7
Реализация пайплайнов данных
↗
43
21
5м 23с
0
Открытый
4.8
Мониторинг и управление потоками
↗
33
20
0м 26с
0
5. Управление качеством и целостностью данных
8 уроков
194
140
5м
0
Открытый
5.1
Data Quality и его метрики
↗
32
21
1м 32с
0
Открытый
5.2
Проверки валидности и полноты данных
↗
25
20
1м 40с
0
Открытый
5.3
Аномалии и дубликаты
↗
25
19
1м 41с
0
Открытый
5.4
Контроль бизнес-правил
↗
24
17
0м 20с
0
Открытый
5.5
Инструменты Data Quality (Great Expectations, Deequ)
↗
25
16
0м 27с
0
Открытый
5.6
Логирование и аудит изменений данных
↗
23
16
0м 22с
0
Открытый
5.7
Контроль источников и происхождения данных
↗
20
16
1м 15с
0
Открытый
5.8
Встроенные проверки в пайплайнах
↗
20
15
0м 19с
0
6. Управление метаданными и каталогизация
8 уроков
176
121
3м
0
Открытый
6.1
Метаданные — типы и назначение
↗
24
15
0м 14с
0
Открытый
6.2
Технические и бизнес-метаданные
↗
21
16
0м 24с
0
Открытый
6.3
Data Catalog и поиск данных
↗
18
15
0м 26с
0
Открытый
6.4
Инструменты каталогизации (DataHub, Collibra, Amundsen)
↗
25
15
0м 23с
0
Открытый
6.5
Линейка данных (Data Lineage)
↗
25
15
0м 17с
0
Открытый
6.6
Автоматическое извлечение метаданных
↗
19
15
0м 20с
0
Открытый
6.7
Управление версиями схем
↗
22
15
0м 29с
0
Открытый
6.8
Связь метаданных с системами качества и безопасности
↗
22
15
0м 9с
0
7. Master Data и Reference Data Management
8 уроков
163
107
2м
0
Открытый
7.1
Что такое Master Data и Reference Data
↗
22
15
0м 14с
0
Открытый
7.2
Архитектура MDM-систем
↗
25
14
0м 17с
0
Открытый
7.3
Идентификация и согласование записей
↗
19
14
0м 13с
0
Открытый
7.4
Управление справочниками
↗
20
14
0м 13с
0
Открытый
7.5
Модели владения данными (consolidation, registry, coexistence)
↗
20
14
0м 15с
0
Открытый
7.6
Интеграция MDM с DWH и CRM
↗
24
12
0м 27с
0
Открытый
7.7
Обеспечение целостности мастер-данных
↗
15
12
0м 13с
0
Открытый
7.8
Проектирование MDM-процесса
↗
18
12
0м 23с
0
8. Безопасность и управление доступом к данным
8 уроков
187
104
3м
0
Открытый
8.1
Модели безопасности данных (RBAC, ABAC)
↗
32
14
0м 20с
0
Открытый
8.2
Шифрование и маскирование данных
↗
26
13
0м 27с
0
Открытый
8.3
Управление доступом и аудит
↗
20
14
0м 15с
0
Открытый
8.4
Сегментация данных и защита PII
↗
23
14
0м 23с
0
Открытый
8.5
Data Governance и соответствие (GDPR, HIPAA)
↗
22
13
0м 13с
0
Открытый
8.6
Классификация данных по чувствительности
↗
21
13
0м 29с
0
Открытый
8.7
Политики доступа и разграничение ролей
↗
22
12
0м 16с
0
Открытый
8.8
Архитектура безопасной работы с данными
↗
21
11
0м 23с
0
9. DataOps и автоматизация
8 уроков
161
96
2м
0
Открытый
9.1
Концепция DataOps
↗
21
12
0м 10с
0
Открытый
9.2
CI/CD для данных
↗
21
12
0м 11с
0
Открытый
9.3
Управление пайплайнами (Airflow, Prefect)
↗
25
13
0м 21с
0
Открытый
9.4
Контроль версий данных (DVC, LakeFS)
↗
21
12
0м 19с
0
Открытый
9.5
Тестирование данных
↗
17
12
1м 32с
0
Открытый
9.6
Обеспечение наблюдаемости данных (Data Observability)
↗
19
12
0м 20с
0
Открытый
9.7
Автоматизация процессов качества и мониторинга
↗
19
11
0м 13с
0
Открытый
9.8
Интеграция DataOps в экосистему DevOps
↗
18
12
0м 10с
0
10. Архитектурное проектирование систем данных
8 уроков
187
105
2м
0
Открытый
10.1
Анализ требований к системе данных
↗
22
15
0м 9с
0
Открытый
10.2
Проектирование потоков данных
↗
23
13
0м 22с
0
Открытый
10.3
Определение слоёв архитектуры (Raw, Curated, Analytics)
↗
25
14
0м 20с
0
Открытый
10.4
Выбор инструментов и технологий
↗
22
13
0м 22с
0
Открытый
10.5
Обеспечение надёжности и масштабируемости
↗
19
13
0м 13с
0
Открытый
10.6
Архитектура данных для BI и ML
↗
24
13
0м 14с
0
Открытый
10.7
Оценка архитектуры и trade-offs
↗
21
12
0м 25с
0
Открытый
10.8
Примеры типовых архитектур решений
↗
31
12
0м 17с
0