Курс на Stepik
Обложка курса «Apache Spark на Scala» на Stepik
Бесплатно

Apache Spark на Scala 0.000

Открыть на
STEPIK.ORG

Практический курс по Apache Spark 3.5 на Scala для дата-инженеров: от архитектуры Spark и DataFrame API до Spark SQL, shuffle, join, Structured Streaming, оптимизации и итогового ETL-проекта.

Показатель Текущие показатели Рост
Значение 🏆 Рейтинг 3 дн 7 дн 30 дн
Количество учеников на курсе «Apache Spark на Scala»Учеников на курсе 1
Сертификаты, выданные на курсе «Apache Spark на Scala»Сертификатов выдано 0
Отзывы о курсе «Apache Spark на Scala»Отзывов получено 0
Рейтинг курса «Apache Spark на Scala»Рейтинг курса 0.000
Уроки в курсе «Apache Spark на Scala»Количество уроков 130
Тесты в курсе «Apache Spark на Scala»Количество квизов 646
Обновления курса «Apache Spark на Scala»Обновления курса
Дата публикации курса «Apache Spark на Scala»Дата публикации курса
Последнее обновление курса «Apache Spark на Scala»Последнее обновление

Чему вы научитесь

Как стать Senior Data Engineer за 3 года и не сойти с ума

Курс входит в линейку материалов канала Логово Дата-Инженера. Автор канала — Дима, Senior Data Engineer в Сбере. В канале публикуются hard-skill материалы по Data Engineering, разборы live-собеседований, заметки по архитектуре Enterprise-проектов и практические карты роста от junior до senior.

О курсе

Apache Spark на Scala — практический курс для тех, кто уже знает основы Scala и хочет уверенно работать со Spark в задачах дата-инженерии: читать, трансформировать, агрегировать, соединять, оптимизировать и сопровождать пайплайны данных.

Что внутри

  • 20 модулей и 130 уроков: от архитектуры Spark до итогового ETL-проекта.
  • 646 тестовых вопросов для самопроверки.
  • 479 практических задач и разборов решений.
  • DataFrame, Dataset, Spark SQL, RDD, shuffle, join, partitioning, caching, AQE, Structured Streaming и production-настройки.

Кому подойдет

Дата-инженерам, backend-разработчикам и аналитикам, которые уже знакомы с базовым программированием и хотят перейти от учебных примеров к реальным Spark-пайплайнам.

Формат

Самостоятельное прохождение по схеме: теория, примеры на Scala/Spark, тест для самопроверки и практические задачи с решениями. Оценочная нагрузка: 90-130 часов.

Результат

После курса студент сможет запускать Spark-приложения, работать с DataFrame и Dataset API, читать Spark UI, выбирать join-стратегии, разбираться с shuffle и перекосом данных, строить batch/streaming-пайплайны и доводить Spark-задачи до production-уровня.

Telegram

Разборы по Spark, Kafka, Flink, Hadoop, Airflow, ClickHouse, S3, Docker/K8s, Python/Scala, live-собеседования и архитектура Enterprise-проектов публикуются в канале Логово Дата-Инженера.

О курсе

Практический курс по Apache Spark 3.5 на Scala для дата-инженеров: от архитектуры Spark и DataFrame API до Spark SQL, shuffle, join, Structured Streaming, оптимизации и итогового ETL-проекта.

Начальные требования

Базовое знание Scala, понимание коллекций, функций и sbt. Желателен опыт с SQL и общими задачами обработки данных.

Преподаватели курса

Нагрузка

90-130 часов

Расскажите о курсе друзьям