Это набор курсов для погружения в IT направление "Большие данные" как Data Engineer. Со включенным сюда дополнительным курсом PySpark Вы изучите основы распределённых вычислений с Apache Spark, научитесь работать с RDD и DataFrame, познакомитесь с Spark SQL, оптимизацией запросов, потоковой обработкой и библиотекой машинного обучения MLlib. По окончании курса По окончании курса Вам будет предложено решить финальное задание на выбор, которое пойдет в Ваше портфолио и отразит все знания, полученные на курсе.
Хороший обзор того что должен уметь DE, но не курс. Отличная задумка но неполная, а местами отвратительная реализация.
Не хватает полноты, одна замануха на другие курсы.
Вопросы и код местами не связаны с обучающим материалом.
По большинству видео складывается ощущение что взяли какого то пацана с базара и заставили читать про то что он в глаза не видел на пленочном магнитофоне с тихим звуком. Давно уж пора переписать и заменить это стыдобище.
Выбирал по полноте содержания\оглавления, мне понравилось что есть практически всё что нужно.
Очень забавно наблюдать, как «случайный пользователь» с аккаунта, созданного 8 лет назад, внезапно просыпается именно сейчас и начинает строчить отзывы, параллельно решая по 45 задач в день 🙂
Обычно так делают не люди, которым «не понравился курс», а конкуренты, у которых почему-то сильно горит от чужих успехов.
Особенно смешно читать про «пацана с базара» от человека, который сутками сидел на платформе и продолжал решать задачи. Видимо, настолько «отвратительная реализация», что вы не могли оторваться 🙂
Если уж занимаетесь дешевым черным пиаром — делайте это хотя бы не настолько открыто )
Кому лень читать, напишу сначала очень кратко: курс очень хорош для общего понимания всего стека, но он очень плох для того, чтобы разбираться в каждой отдельной технологии даже на базовом уровне.
Курс купил программой, поэтому он достался мне как бы "допом". Поэтому мнение может не сойтись с Вашим (тех кто выбирает по отзывам). Итак, плюсы:
1. Очень объемный курс. Здесь рассматривается огромный стек вокруг анализа данных. Сюда же цена курса.
2. Лично для меня оказалась полезной первая половина, где рассказывается жизненный путь данных от сырых до дашбордов).
3. Очень хорошо преподносится и разжевывается информация. Именно в тех модулях, где закладывается база. Ну это первая половина.
4. После прохождения курса при чтении любой вакансии сразу становится понятно, твое это или нет. То есть ты имеешь представление о большом количестве технологий.
Теперь по минусам.
1. Что касается стека, все пробегается вскольз.
2. Продвинутые темы в модулях не имеют никакого смысла, потому что все очень кратко. С нуля вы ничего не поймете.
Если вы видите в содержании курса python: ООП, будьте готовы, что для уверенного понимания ООП вам нужно пройти целый отдельный курс на питон, или даже серию курсов.
3. Если вы хотите пройти курс и сразу считать себя джуном ДЕ, курса будет точно не достаточно. В каждом модуле нужно изучать доп источники/курсы. Я изучал допом для общего развития, при этом частично скипал модули.
Хороший курс для людей , которые только начали обучается работы с данными. Основные информация по каждой теме обозначена, есть множество практических задач. Тестовые задания быстро проверяются и дается небольшая обратная связь если что то нужно доработать.
Нужно учесть что дается краткая выжимка информации, для развития надо читать разные источники и постоянно практиковаться.
После прохождения курса я научился работать с PySpark и познакомился с распределённой обработкой данных. Ранее со Spark не работал, для меня было полезно разобраться в его концепциях, отличиях от pandas и особенностях ленивых вычислений.
Практика выполнялась в Google Colab, я решил не париться с развертыванием, ведь для меня это было не так важно, но в курсе описано и как развернуть локально.
В ходе курса узнал все основные моменты на мой взгляд, которые понадобятся в работе и могут спросить на собесах, дальше самому уже практиковаться и углублять полученные знания.
P. S. Я в конечном итоге залил себе на гит проекты, которые получились после прохождения курса (это работа с RDD и DataFrame) думаю для работодателей в резюме будет однозначно как плюс как для DE, так и для DA
Немного не понял ситуацию с разделами курса 6 и выше, пишет раздел недоступен, я так предполагаю, что курс еще допиливается, автор поправь меня если что-то не так сказал.
Курс выбирал по цене, но честно говоря аналогов я не находил, по крайней мере на рунете .