Чему вы научитесь
- Работа с RDD: создание, трансформация, базовые операции.
- DataFrames и SQL: работа с таблицами, фильтрация и агрегация данных.
- Функции: использование lambda, map, filter для обработки данных, и многие другие.
О курсе
Курс по pySpark для инженеров данных и не только. Обучение с нуля. Ключевые слова: Data Science, Data Engineer, инженер данных, Spark
Для кого этот курс
Курс для будущих инженеров данных и людей из смежных областей.
Начальные требования
Знание Python
Рекомендуется, но не обязательно знание SQL
Преподаватели курса
Как проходит обучение
Онлайн формат: Вы получаете доступ к урокам в удобное для вас время, что позволяет учиться в собственном темпе.
Автоматические проверки: Выполняя кодовые задания, вы сразу увидите результат работы и сможете проверить свои ответы.
Тесты: Для самопроверки предусмотрены тесты, которые позволят оценить ваше понимание теоретического материала.
Сертификат
Успешно завершив курс, вы получите сертификат от платформы Stepik. Уже 162 учеников получили сертификат.
Что вы получите
- Диплом
- Навыки работы с pySpark достаточные для качественной и эффективной работы
- Инструменты и знания необходимые для работы