Сколько стоит курс «Симулятор-практикум по Lakehouse: Iceberg + Spark»?

Курс «Симулятор-практикум по Lakehouse: Iceberg + Spark» доступен бесплатно.

Какой рейтинг у курса «Симулятор-практикум по Lakehouse: Iceberg + Spark»?

Курс имеет рейтинг 0.0 из 5 на основе 0 отзывов. На курсе обучается 0 учеников.

Где можно пройти курс «Симулятор-практикум по Lakehouse: Iceberg + Spark»?

Курс доступен на образовательной платформе Stepik по адресу stepik.org/course/292619.

Симулятор-практикум по Lakehouse: Iceberg + Spark

Name: Симулятор-практикум по Lakehouse: Iceberg + Spark
Availability: InStock
Rating: 0 (0 reviews)

Показатель	Текущие показатели	Рост
Учеников на курсе	0
Сертификатов выдано	0
Отзывов получено	0
Рейтинг курса	0.000
Количество уроков	3
Количество квизов	8
Обновления курса	—	—
Дата публикации курса	17 часов назад	—	—	—	—
Последнее обновление	26 июня 2026	—	—	—	—
Сложность	normal	—	—	—	—

Чему вы научитесь

Разворачивать локальный стенд Lakehouse. Запускать готовое окружение (mydatalab) с помощью Docker Compose, чтобы экспериментировать с технологиями без облачных затрат.
Настраивать Spark-сессию для работы с Iceberg. Писать код на PySpark, который подключается к REST Catalog (Lakekeeper) и S3-совместимому хранилищу (MinIO), используя правильные конфигурационные свойства (spark.sql.extensions, spark.sql.catalog).
Управлять пространствами имен (namespace). Создавать namespace через Spark SQL (CREATE NAMESPACE ...), чтобы логически группировать таблицы.
Создавать таблицы в Spark. Создавать управляемые (managed) таблицы в формате Iceberg с определением колонок и типов данных.
Записывать данные в Iceberg таблицы. Выполнять запись данных двумя основными способами:
Используя DataFrame API (df.writeTo("...").append()).
Используя Spark SQL (INSERT INTO ... VALUES ...).

О курсе

Знакомимся с архитектурой Lakehouse и назначением её компонентов: MinIO, Apache Iceberg, Lakekeeper и Spark. Разберёшься, как подключить Spark к Iceberg через свойства spark.sql.extensions и spark.sql.catalog, как указать тип rest и параметры S3. На практике развернёшь стенд mydatalab, подключишься к S3, создашь namespace experiment и таблицу first_table с полем message типа STRING. Запишешь данные двумя способами: через DataFrame API и через Spark SQL.

Для кого этот курс

ДАТА ИНЖЕНЕР Переход с классических СУБД на Big Data Если вы работаете с реляционными базами и хотите освоить современный индустриальный стандарт — этот симулятор для вас. ДАТА АДМИНИСТРАТОР Архитектура хранения больших данных Разберитесь в устройстве табличных форматов и управлении метаданными в масштабируемых системах. ДАТА АРХИТЕКТОР Проектирование модульных систем Отработайте навыки построения архитектур с разделением хранения и вычислений на реальных кейсах.

Начальные требования

Опыт от 1 года в роли Data Engineer, Data Administrator или Data Architect.
Уверенный SQL: писать сложные запросы, понимать устройство таблиц и схем.
Базовый Python: читать и писать простой код, работать с данными.
Понимание основ DWH и ETL: знать, как устроены хранилища и процессы загрузки данных.
Навыки работы с терминалом: запускать команды, работать с Docker.

Важно: глубокие знания Spark, Iceberg и Lakehouse не требуются — мы всему научим на курсе.

Преподаватели курса

Инженерка Тех

Помогаем инженерам повысить свой уровень до международного | ✅ О нас и наших тренажерах https://inzhenerka.tech

★ 4.5

15 курсов

6 953

→

Как проходит обучение

Курс построен как сюжетный симулятор: вы — инженер данных Толик в продуктовой ИТ-команде, и каждый шаг — это новая вводная от руководителей (Енисея, Эдика, Ариелы) или правка от заказчика.

Теорию сразу закрепляете практикой: задания выполняются в облачной IDE прямо в браузере, с мгновенной автопроверкой — ничего устанавливать для заданий не нужно. Демо проходите бесплатно и в своем темпе.

Как выглядит обучение на практике:

Погружение в контекст. Вы читаете диалоги команды, понимаете бизнес-задачу и технические требования.
Теоретический блок. Изучаете документацию и отвечаете на вопросы, чтобы закрепить понимание архитектуры.
Практика в IDE. Переходите в JupyterLab (встроенный в браузер) и выполняете код: настраиваете Spark, создаете таблицы, пишете запросы.
Мгновенная проверка. Система автоматически проверяет ваше решение и показывает результат.
Следующая вводная. В зависимости от успеха, вы переходите к следующему шагу с новым заданием от команды.

Итог: вы не просто смотрите лекции, а проживаете реальный проект от старта до готового продукта — Lakehouse на стеке Apache Spark и Iceberg.

Что вы получите

Практические навыки работы с современным стеком Big Data, востребованные работодателем (Apache Spark, Iceberg, S3).
Возможность сразу отработать теорию на практике в реальной среде — вы не просто смотрите, а сами подключаете Spark к Iceberg и создаете таблицы.
Доступ к готовому локальному стенду mydatalab — всё необходимое для работы уже развернуто в Docker.
Понимание архитектуры Lakehouse и роли каждого компонента: MinIO (S3), Apache Iceberg, Lakekeeper и Spark.
Навыки настройки Spark-сессии для работы с Iceberg через свойства spark.sql.extensions и spark.sql.catalog.
Опыт работы с S3 — подключение к объектному хранилищу и создание namespace.
Опыт работы с таблицами в Iceberg — создание таблицы с полем message типа STRING.
Навыки записи данных двумя способами — через DataFrame API и через Spark SQL.
Базовые навыки работы с Jupyter Notebook в облачной IDE.
Бессрочный доступ к материалам демо-урока — можете возвращаться и пересматривать в любое время.
Понимание формата обучения — вы оцениваете, подходит ли вам сюжетный симулятор, и принимаете взвешенное решение о покупке полной версии курса.

Расскажите о курсе друзьям

Прямая ссылка на курс: stepik.org/292619

Симулятор-практикум по Lakehouse: Iceberg + Spark ★ 0.000