Чему вы научитесь
- основы Data Quality
- реализация проверок DQ с помощью GE на csv-файлах
- установка Docker
- установка ClickHouse
- реализация проверок DQ с помощью SQL на примере базы данных ClickHouse
- работа в dbeaver - популярная среда разработки SQL
- реализация проверок DQ с помощью GE на примере базы данных ClickHouse
- анализ текущей ситуации на рынке, понимание, как развивается DQ в России
О курсе
Введение в Data Quality (качество данных). Молодое направление, набирающее популярность. Рассмотрим на примере одной из самых популярных библиотек - Great Expectations
Для кого этот курс
Данный курс предназначен для всех, кто так или иначе работает / планирует работать с данными.
Начальные требования
Для успешного прохождения курса необходимо:
- Знание Docker, либо быть готовым повторить всё за преподавателем
- Знания SQL обязательно (select, where, group by, having, order by, join и т.д.). Вы умеете писать SQL-запросы. Вы понимаете, что такое база данных, и что различных систем управления базой данных (СУБД) очень много (Postgres, ClickHouse, MySQL и т.д.).
- Знания Python обязательно - вы знакомы с типами данных, функциями. Знаете про библиотеки - панды ваши друзья. Желательно знать какую-либо IDE (PyCharm, VSCode), но не обязательно.
Преподаватели курса
Что вы получите
- Передовые знания о Data Quality
- Комьюнити единомышленников
- Умение работать с самым передовым стеком технологий
- Понимание рынка DQ в России
Нагрузка
10 часов в неделю