Чему вы научитесь
- Проектировать таблицы-ракеты: Выбирать такие ключи распределения, чтобы данные джойнились мгновенно и без перегрузки сети.
- Качать данные терабайтами: Мастерски использовать gpfdist и PXF для максимально быстрой параллельной загрузки из файлов или облаков.
- Видеть базу насквозь: Читать планы запросов (EXPLAIN), находить причины тормозов и понимать, куда и зачем «летают» данные между сегментами.
- Укрощать статистику: Настраивать обслуживание через ANALYZE, чтобы оптимизатор никогда не ошибался.
- Бороться с перекосами: Диагностировать и исправлять ситуации, когда один сервер работает за всех, а остальные простаивают.
О курсе
Курс посвящен изучению архитектуры и навыков работы с одной из самых мощных MPP-систем для построения хранилищ данных
Для кого этот курс
Курс идеально подойдет:
Data-инженерам (DE): Чтобы строить быстрые ETL-процессы и проектировать архитектуру хранилищ (DWH), которая не «тормозит».
Аналитикам данных: Чтобы понимать, как писать тяжелые SQL-запросы, которые будут выполняться секунды вместо часов.
Архитекторам данных: Чтобы разобраться в преимуществах MPP-архитектуры и правильно внедрять Greenplum в ИТ-ландшафт компании.
Начальные требования
Минимальные требования: уверенное знание SQL и базовое понимание работы баз данных.
Преподаватели курса
Как проходит обучение
Проходит в комфортном для вас режиме, без дедлайнов в своем темпе изучаете, после теории будут тестовые задания по ключевым вопросам для закрепления.
Что вы получите
- Возможность использовать курс как шпаргалку
- Понимание внутрянки Greenplum
- Умение писать качественные запросы, а также качественное проектирование таблиц
- Оптимизировать запросы
- Работать со статистикой
- Понимать различные типы таблиц