Чему вы научитесь
- Разворачивать рабочую среду: Docker, ClickHouse и DBeaver.
- Строить многослойное хранилище (DWH): от сырых логов до витрин.
- Проектировать таблицы на базе движка MergeTree, выбирать оптимальные типы данных и загружать массивы сырых логов.
- Очищать данные от мусора средствами самого ClickHouse, используя модификаторы EXCEPT и REPLACE.
- Настраивать дедупликацию данных с помощью движка ReplacingMergeTree.
- Собирать витрины данных, которые работают быстро и решают задачи бизнеса, используя SummingMergeTree и AggregatingMergeTree.
- Создавать внешние словари Dictionary и настраивать обогащение данных.
- Настраивать загрузку данных в витрины с помощью Incremental и Refreshable Materialized View.
- Рассчитывать продуктовые метрики.
О курсе
Для кого этот курс
Начальные требования
Для комфортного обучения необходимы теоретические знания основ ClickHouse и умение писать простые SQL-запросы (фильтрация, группировка, JOIN). Получить их можно на бесплатном курсе «ClickHouse с нуля».
Преподаватели курса
Как проходит обучение
Курс состоит из прикладной теории в текстовом формате, тестов для самопроверки и практического задания в конце каждого урока, которое является частью сквозного проекта.
Выполняя эти задания шаг за шагом, мы соберем единую систему хранения данных, поймем взаимосвязи между слоями хранилища и рассчитаем продуктовые метрики.
Уровень сложности задач может варьироваться. Как и в реальных ИТ-проектах, одни части системы требуют меньшей проработки и решаются проще, тогда как другие — значительно сложнее и потребуют большего погружения.