После прохождения курса я научился работать с PySpark и познакомился с распределённой обработкой данных. Ранее со Spark не работал, для меня было полезно разобраться в его концепциях, отличиях от pandas и особенностях ленивых вычислений. Практика выполнялась в Google Colab, я решил не париться с развертыванием, ведь для меня это было не так важно, но в курсе описано и как развернуть локально. В ходе курса узнал все основные моменты на мой взгляд, которые понадобятся в работе и могут спросить на собесах, дальше самому уже практиковаться и углублять полученные знания. P. S. Я в конечном итоге залил себе на гит проекты, которые получились после прохождения курса (это работа с RDD и DataFrame) думаю для работодателей в резюме будет однозначно как плюс как для DE, так и для DA Немного не понял ситуацию с разделами курса 6 и выше, пишет раздел недоступен, я так предполагаю, что курс еще допиливается, автор поправь меня если что-то не так сказал. Курс выбирал по цене, но честно говоря аналогов я не находил, по крайней мере на рунете .
12 500 ₽
PySpark с нуля
Открыть наSTEPIK.ORG
Курс предназначен для начинающих специалистов в области обработки больших данных. Вы изучите основы распределённых вычислений с Apache Spark, научитесь работать с RDD и DataFrame, познакомитесь с Spark SQL, оптимизацией запросов, потоковой обработкой и библиотекой машинного обучения MLlib. В финале курса Вы решите практическое задание и добавите готовый проект в портфолио.
| Показатель | Текущие показатели | Рост | |||
|---|---|---|---|---|---|
| Значение | 🏆 Рейтинг | 3 дн | 7 дн | 30 дн | |
| 266 | |||||
| 0 | |||||
| 1 | |||||
| 5.000 | |||||
| 56 | |||||
| 221 | |||||
| 6 | |||||
| — | |||||
| 12 500 ₽ | — | ||||
| — | — | ||||
| — | — | — | — | ||
| — | — | — | — | ||
| Сложность | easy | — | — | — | — |