Курс на Stepik
Обложка курса «Построение аналитической платформы c Trino, MinIO (S3)» на Stepik
2 000 ₽

Построение аналитической платформы c Trino, MinIO (S3) 5.000

Открыть на
STEPIK.ORG

Научитесь работать с DataLakehouse и облачным хранилищем на практике. Для внимательных промокод в описании.

Показатель Текущие показатели Рост
Значение 🏆 Рейтинг 3 дн 7 дн 30 дн
Количество учеников на курсе «Построение аналитической платформы c Trino, MinIO (S3)»Учеников на курсе 1
Сертификаты, выданные на курсе «Построение аналитической платформы c Trino, MinIO (S3)»Сертификатов выдано 0
Отзывы о курсе «Построение аналитической платформы c Trino, MinIO (S3)»Отзывов получено 1
Рейтинг курса «Построение аналитической платформы c Trino, MinIO (S3)»Рейтинг курса 5.000
Уроки в курсе «Построение аналитической платформы c Trino, MinIO (S3)»Количество уроков 15
Тесты в курсе «Построение аналитической платформы c Trino, MinIO (S3)»Количество квизов 24
Стоимость курса «Построение аналитической платформы c Trino, MinIO (S3)»Стоимость курса 2 000 ₽
Обновления курса «Построение аналитической платформы c Trino, MinIO (S3)»Обновления курса
Дата публикации курса «Построение аналитической платформы c Trino, MinIO (S3)»Дата публикации курса
Последнее обновление курса «Построение аналитической платформы c Trino, MinIO (S3)»Последнее обновление

Чему вы научитесь

  • Проектировать Озера Данных: Строить правильную Медальонную архитектуру данных от сырого слоя (Raw/Bronze) до готовых бизнес-витрин (Business/Gold).
  • Управлять объектными хранилищами: Понимать логику работы S3 API, бакетов и неизменяемости файлов (Immutability).
  • Оптимизировать Big Data запросы: Использовать колоночный формат Parquet, настраивать партиционирование данных по датам и применять технологию File Pruning (отсечение лишних файлов) для ускорения SQL-запросов в 100 раз.
  • Справляться с изменениями бизнеса: Настраивать эволюцию схем данных (Schema Evolution) и работать с передовыми табличными форматами вроде Apache Iceberg.

О курсе

Научитесь работать с DataLakehouse и облачным хранилищем на практике. Для внимательных промокод в описании.

Для кого этот курс

Аналитики данных (Data Analysts): Которые хотят вырасти до уровня Senior/Lead, перестать зависеть от классических баз данных и научиться самостоятельно анализировать гигантские сырые логи из Озер данных. Начинающие инженеры данных (Data Engineers): Которые хотят получить крепкую базу, понять физику колоночного хранения, маппинга типов данных и построения ELT-пайплайнов. Backend-разработчики: Желающие расширить свой стек и понять, как устроена инфраструктура аналитики больших данных на стороне заказчика.

Начальные требования

  • Базовые знания синтаксиса SQL (умение писать простые SELECT, WHERE и GROUP BY).
  • Минимальное понимание того, как запускать готовые ячейки кода в Google Colab (на уровне нажатия кнопки Play). Знание Python не обязательно — весь тяжелый анализ мы пишем на чистом SQL.

Преподаватели курса

Как проходит обучение

Вам не понадобятся мощный компьютер, установка тяжелых программ или платные облака. Специально для курса мы разработали стабильную и легковесную песочницу внутри Google Colab.

Прямо в браузере в один клик вы развернете полноценное аналитическое окружение. Вы будете писать реальный SQL-код, имитировать загрузку логов, физически выгружать Parquet-файлы и строить автоматические конвейеры обработки данных.

Что вы получите

  • Полноценное портфолио дата-инженера: Готовый репозиторий с рабочим кодом современной Lakehouse-платформы, который можно смело показывать на собеседованиях
  • .Доступ к интерактивной песочнице: Легковесный шаблон блокнота Google Colab, который запускается за 2 секунды, не падает по памяти и остается у вас навсегда для личных и рабочих проектов.
  • Глубокие практические навыки: Вы не просто изучите теорию Big Data, а своими руками настроите слои данных, выполните экспорт в Parquet, запустите федеративные запросы и построите сквозной ELT-конвейер.
  • Умение оптимизировать затраты бизнеса: Вы научитесь архитектурно разделять хранение и вычисления, настраивать партиционирование и File Pruning, что позволяет обрабатывать огромные массивы данных за минимальный бюджет.
  • Понимание современных Big Data трендов: Вы разберетесь в устройстве передовых технологий и форматов, таких как Trino, MinIO, Apache Iceberg и колоночное сжатие данных.
  • Пожизненный доступ к материалам: Все обновления уроков, текстовые конспекты без лишней воды и практические задачи со шпаргалками будут доступны вам в любое время.

Расскажите о курсе друзьям