Курс на Stepik
Обложка курса «Data Quality в пайплайнах: SQL, Python, Great Expectations» на Stepik
2 490 ₽

Data Quality в пайплайнах: SQL, Python, Great Expectations 5.000

Открыть на
STEPIK.ORG

Научитесь автоматически находить грязные данные и останавливать пайплайн до того, как они сломают аналитику. SQL-проверки, Python-валидация с Pydantic и Pandera, Great Expectations, Data Observability и интеграция в Airflow: всё в одном курсе с прикладным e-commerce проектом

Показатель Текущие показатели Рост
Значение 🏆 Рейтинг 3 дн 7 дн 30 дн
Количество учеников на курсе «Data Quality в пайплайнах: SQL, Python, Great Expectations»Учеников на курсе 18
Сертификаты, выданные на курсе «Data Quality в пайплайнах: SQL, Python, Great Expectations»Сертификатов выдано 1
Отзывы о курсе «Data Quality в пайплайнах: SQL, Python, Great Expectations»Отзывов получено 1
Рейтинг курса «Data Quality в пайплайнах: SQL, Python, Great Expectations»Рейтинг курса 5.000
Уроки в курсе «Data Quality в пайплайнах: SQL, Python, Great Expectations»Количество уроков 38
Тесты в курсе «Data Quality в пайплайнах: SQL, Python, Great Expectations»Количество квизов 23
Время прохождения курса «Data Quality в пайплайнах: SQL, Python, Great Expectations»Время прохождения курса
Стоимость курса «Data Quality в пайплайнах: SQL, Python, Great Expectations»Стоимость курса 2 490 ₽
Обновления курса «Data Quality в пайплайнах: SQL, Python, Great Expectations»Обновления курса
Дата публикации курса «Data Quality в пайплайнах: SQL, Python, Great Expectations»Дата публикации курса
Последнее обновление курса «Data Quality в пайплайнах: SQL, Python, Great Expectations»Последнее обновление
Сложность normal

Содержание курса

Разделы в курсе «Data Quality в пайплайнах: SQL, Python, Great Expectations» 8 разделов Уроки в курсе «Data Quality в пайплайнах: SQL, Python, Great Expectations» 38 уроков Тесты в курсе «Data Quality в пайплайнах: SQL, Python, Great Expectations» 23 теста Время прохождения курса «Data Quality в пайплайнах: SQL, Python, Great Expectations» 1 ч. Последнее обновление курса «Data Quality в пайплайнах: SQL, Python, Great Expectations» обн. 7 мая 2026

1. Введение

4 урока
Закрытый
1.1 О чём этот курс и кому он подойдёт
3
0
3м 34с
0
Закрытый
1.2 Как устроен курс и как его проходить
0
0
-
0
Закрытый
1.3 Что такое Data Quality и почему это важно
0
0
4м 20с
0
Открытый
1.4 Архитектура проекта курса
1
1
-
0

2. Типичные проблемы качества данных

5 уроков
Закрытый
2.1 Какие проблемы бывают в данных
0
0
-
0
Закрытый
2.2 Почему ломаются аналитические пайплайны
0
0
-
0
Закрытый
2.3 Проверки качества данных: основные категории
1
0
-
0
Закрытый
2.4 Практика: анализ данных интернет-магазина
0
0
3м 21с
0
Закрытый
2.5 Практика: поиск проблем качества данных
1
0
-
0

3. SQL-проверки качества данных

7 уроков
Закрытый
3.1 Почему SQL=основной инструмент Data Quality
1
0
2м 28с
0
Закрытый
3.2 NULL (completeness=полнота)
0
0
-
0
Закрытый
3.3 Дубликаты (uniqeness=уникальность)
0
0
-
0
Закрытый
3.4 Диапазоны (validity=валидность)
0
0
-
0
Открытый
3.5 Связность (Referential integrity)
3
1
-
0
Закрытый
3.6 Схема (schema checks)
1
0
-
0
Закрытый
3.7 Практика: пишем SQL-checks
1
0
1м 51с
0

4. Data Quality проверки в Python

5 уроков
Закрытый
4.1 Когда SQL-проверок недостаточно
1
0
2м 44с
0
Закрытый
4.2 Валидация данных с Pydantic
0
0
-
0
Закрытый
4.3 Проверка DataFrame с Pandera
1
0
-
0
Закрытый
4.4 Практика: validation pipeline
1
0
-
0
Закрытый
4.5 Практика: обработка ошибок данных
1
0
-
0

5. Проверки данных с Great Expectations

5 уроков
Закрытый
5.1 Что такое Great Expectations?
1
0
3м 48с
0
Закрытый
5.2 Типы проверок (expectations)
1
0
-
0
Закрытый
5.3 Создание validation suite
1
0
-
0
Открытый
5.4 Data Docs и отчёты проверок
2
1
-
0
Закрытый
5.5 Практика: проверка dataset
0
0
-
0

6. Data Observability

5 уроков
Закрытый
6.1 Data Observability: что это такое
0
0
2м 56с
0
Закрытый
6.2 Freshness checks
1
0
-
0
Закрытый
6.3 Volume monitoring
0
0
-
0
Закрытый
6.4 Schema monitoring
1
0
-
0
Закрытый
6.5 Практика: мониторинг таблицы
0
0
-
0

7. Интеграция проверок в Airflow

4 урока
Закрытый
7.1 Где запускать Data Quality проверки
0
0
-
0
Закрытый
7.2 Data Quality задачи в Airflow
0
0
-
0
Закрытый
7.3 Fail pipeline при ошибке данных
1
0
-
0
Открытый
7.4 Практика: добавляем проверки в DAG
3
1
4м 7с
0

8. Финальный проект

3 урока
Закрытый
8.1 Постановка задачи
0
0
-
0
Закрытый
8.2 Реализация
0
0
-
0
Закрытый
8.3 Самопроверка / эталон
1
0
2м 37с
0