Чему вы научитесь
- ✔ находить NULL-значения в ключевых полях
- ✔ выявлять дубликаты и понимать, как они искажают метрики
- ✔ проверять корректность значений (диапазоны, аномалии)
- ✔ находить проблемы в связях между таблицами
- ✔ контролировать структуру данных (schema checks)
- ✔ собирать базовый набор SQL-проверок для своих данных
- ✔ работать с данными локально в DuckDB без настройки
- ✔ мыслить как аналитик Data Quality, а не просто писать SQL
О курсе
Для кого этот курс
Начальные требования
Достаточно базового SQL и компьютера, на который можно поставить DuckDB.
Python и Airflow не нужны: этот курс полностью про SQL
Преподаватели курса
Как проходит обучение
📖 Короткие текстовые уроки с объяснениями и примерами SQL-запросов. Без воды и лишней теории
🔨 Практические задания после каждой темы. Вы пишете запросы руками, а не просто читаете
📊 Работа с реальным датасетом интернет-магазина: каждый батч моделирует конкретную поломку из практики
🦆 DuckDB наш основной инструмент. Устанавливается один раз, работает локально,
читает Parquet напрямую
🎯 Финальная практика: самостоятельный поиск проблем в реальных данных
Что вы получите
- ✔ готовый набор SQL-проверок
- ✔ понимание, как находить ошибки в данных
- ✔ базу для перехода к Data Quality pipeline
- ✔ практику на реальном датасете