Сколько стоит курс «PySpark с нуля»?

Стоимость курса составляет 108000.00 рублей

Сколько времени занимает прохождение курса «PySpark с нуля»?

Прохождение курса «PySpark с нуля» занимает примерно 14 часов.

Какой рейтинг у курса «PySpark с нуля»?

Курс имеет рейтинг 5.0 из 5 на основе 1 отзывов. На курсе обучается 267 учеников.

Где можно пройти курс «PySpark с нуля»?

Курс доступен на образовательной платформе Stepik по адресу stepik.org/course/241343.

Курс на Stepik

Обложка курса «PySpark с нуля» на Stepik

108 000 ₽

PySpark с нуля ★ 5.000

Name: PySpark с нуля
Price: 108000.00 RUB
Availability: InStock
Rating: 5.0 (1 reviews)

Открыть на
STEPIK.ORG

Курс предназначен для начинающих специалистов в области обработки больших данных. Вы изучите основы распределённых вычислений с Apache Spark, научитесь работать с RDD и DataFrame, познакомитесь с Spark SQL, оптимизацией запросов, потоковой обработкой и библиотекой машинного обучения MLlib. В финале курса Вы решите практическое задание и добавите готовый проект в портфолио.

Показатель	Текущие показатели		Рост
Показатель	Значение	🏆 Рейтинг	3 дн	7 дн	30 дн
Учеников на курсе	267
Сертификатов выдано	0
Отзывов получено	1
Рейтинг курса	5.000
Количество уроков	56
Количество квизов	221
Количество задач с кодом	6
Время прохождения курса	14 ч.	—
Стоимость курса	108 000 ₽	—
Обновления курса	—	—
Дата публикации курса	1 год назад	—	—	—	—
Последнее обновление	3 июля 2026	—	—	—	—
Сложность	easy	—	—	—	—

Содержание курса

12 разделов Уроки в курсе «PySpark с нуля»

56 уроков Тесты в курсе «PySpark с нуля»

221 тест Задачи в курсе «PySpark с нуля»

6 задач Время прохождения курса «PySpark с нуля»

14 ч.

обн. 3 июля 2026

1. Знакомство с платформой и сдача практических задач

1 урок

Закрытый

1.1 Введение в курс и платформу ↗

1м 50с

2. Введение в Spark и основы распределенных вычислений

6 уроков

Закрытый

2.1 Что такое Apache Spark и его место в экосистеме Big Data ↗

12м 20с

Закрытый

2.2 Архитектура Spark: драйвер, исполнители, кластерные менеджеры ↗

22м 29с

Закрытый

2.3 Чем Spark лучше Hadoop MapReduce? Отложенные вычисления ↗

8м 53с

Закрытый

2.4 Обзор PySpark API и его особенностей ↗

5м 4с

Закрытый

2.5 Установка и настройка Spark ↗

6м 22с

Закрытый

2.6 Первый запуск PySpark ↗

6м 31с

3. Работа с данными в PySpark: RDD

6 уроков

Открытый

3.1 Что такое RDD (Resilient Distributed Dataset) ↗

185

4м 19с

Закрытый

3.2 Преобразования ↗

14м 50с

Закрытый

3.3 Действия ↗

19м 11с

Закрытый

3.4 Практическое задание ↗

6м 53с

Закрытый

3.5 Самостоятельная работа ↗

7м 0с

Закрытый

3.6 Итоговое задание ↗

4. Работа с данными в PySpark: DataFrame и Spark SQL

11 уроков

234

138

153м

Закрытый

4.1 DataFrame в PySpark: понятие, схема, создание ↗

18м 39с

Закрытый

4.2 Основные операции DataFrame API ↗

39м 6с

Закрытый

4.3 Spark SQL ↗

15м 2с

Закрытый

4.4 Схемы данных и типы ↗

18м 3с

Закрытый

4.5 Встроенные функции PySpark ↗

26м 24с

Закрытый

4.6 User Defined Functions ↗

6м 26с

Закрытый

4.7 Форматы: Avro, Parquet, ORC ↗

18м 18с

Закрытый

4.8 Pandas API ↗

6м 35с

Закрытый

4.9 Практическое задание ↗

4м 9с

Закрытый

4.10 Самостоятельная работа ↗

2м 27с

Закрытый

4.11 Итоговое задание ↗

5. Оптимизация производительности PySpark-приложений

8 уроков

Закрытый

5.1 Широкие и узкие преобразования, shuffle ↗

10м 6с

Закрытый

5.2 Партиционирование ↗

13м 23с

Закрытый

5.3 Анализ плана выполнения (explain), стратегии JOIN ↗

23м 20с

Закрытый

5.4 Обработка неравномерных данных (Data Skew) ↗

11м 44с

Закрытый

5.5 Кэширование (cache, persist) и контрольные точки (checkpoint) ↗

20м 46с

Закрытый

5.6 Catalyst Optymizer ↗

5м 56с

Закрытый

5.7 Tungsten Execution Engine ↗

9м 21с

Закрытый

5.8 Итоговое задание ↗

6. Потоковая обработка с PySpark Structured Streaming

6 уроков

Закрытый

6.1 Введение в PySpark Streaming ↗

2м 22с

Закрытый

6.2 Источники данных для Structured Streaming ↗

Закрытый

6.3 Вывод данных, Режимы вывода и Триггеры ↗

Закрытый

6.4 Управление состоянием и временем ↗

Закрытый

6.5 Самостоятельная работа ↗

Закрытый

6.6 Итоговое задание ↗

7. Машинное обучение с PySpark MLlib

6 уроков

Закрытый

7.1 Введение в PySpark ML ↗

Закрытый

7.2 Предварительная обработка данных ↗

Закрытый

7.3 Основные алгоритмы машинного обучения в PySpark ML ↗

Закрытый

7.4 Оценка моделей в PySpark ML ↗

Закрытый

7.5 Кросс-валидация и подбор гиперпараметров ↗

Закрытый

7.6 Построение и оценка ML Pipelines ↗

8. Интеграция PySpark с внешними системами

1 урок

Закрытый

8.1 Знакомство с хранилищами данных для работы с PySpark ↗

9. Отладка и профилирование PySpark-приложений

1 урок

Закрытый

9.1 Как устранять ошибки? ↗

10. Чеклисты и шпаргалки по PySpark

1 урок

Закрытый

10.1 Основные приемы ↗

11. Продвинутые темы PySpark

1 урок

Закрытый

11.1 Что такое DeltaLake? ↗

12. Финальные проекты

1 урок

Закрытый

12.1 Варианты итоговых работ ↗