Курс на Stepik
Обложка курса «Стажировка Data Engineer | Летний поток 2025» на Stepik
29 999 ₽

Стажировка Data Engineer | Летний поток 2025 5.000

Открыть на
STEPIK.ORG

На этой стажировке Вас ждёт практическое погружение в обработку данных: работа с базами данных, потоковая и batch-обработка (Airflow, Kafka, Spark), настройка ETL-пайплайнов и автоматизация загрузки данных. Вы освоите Docker, Pandas, Hive, PySpark, научитесь парсингу, очистке и загрузке данных. Формат включает индивидуальные и командные задачи, имитирующие реальные проекты в сфере Big Data. Предусмотрена приоритетная и индивидуальная поддержка в рамках чата. 15 онлайн вебинаров. Продолжительность - 3.5 мес.

Показатель Текущие показатели Рост
Значение 🏆 Рейтинг 3 дн 7 дн 30 дн
Количество учеников на курсе «Стажировка Data Engineer | Летний поток 2025»Учеников на курсе 57
Сертификаты, выданные на курсе «Стажировка Data Engineer | Летний поток 2025»Сертификатов выдано 0
Отзывы о курсе «Стажировка Data Engineer | Летний поток 2025»Отзывов получено 7
Рейтинг курса «Стажировка Data Engineer | Летний поток 2025»Рейтинг курса 5.000
Уроки в курсе «Стажировка Data Engineer | Летний поток 2025»Количество уроков 66
Тесты в курсе «Стажировка Data Engineer | Летний поток 2025»Количество квизов 216
Задачи с кодом в курсе «Стажировка Data Engineer | Летний поток 2025»Количество задач с кодом 11
Время прохождения курса «Стажировка Data Engineer | Летний поток 2025»Время прохождения курса
Стоимость курса «Стажировка Data Engineer | Летний поток 2025»Стоимость курса 29 999 ₽
Обновления курса «Стажировка Data Engineer | Летний поток 2025»Обновления курса
Дата публикации курса «Стажировка Data Engineer | Летний поток 2025»Дата публикации курса
Последнее обновление курса «Стажировка Data Engineer | Летний поток 2025»Последнее обновление
Сложность normal

Содержание курса

Разделы в курсе «Стажировка Data Engineer | Летний поток 2025» 11 разделов Уроки в курсе «Стажировка Data Engineer | Летний поток 2025» 66 уроков Тесты в курсе «Стажировка Data Engineer | Летний поток 2025» 216 тестов Задачи в курсе «Стажировка Data Engineer | Летний поток 2025» 11 задач Время прохождения курса «Стажировка Data Engineer | Летний поток 2025» 16 ч. Последнее обновление курса «Стажировка Data Engineer | Летний поток 2025» обн. 11 марта 2026

1. Первые действия

2 урока
Открытый
1.1 Купили, что дальше?
325
206
11м 4с
5
Закрытый
1.2 Телеграмм каналы
71
71
0м 10с
1

2. Организация работы

6 уроков
Закрытый
2.1 Цели стажировки
67
67
1м 24с
1
Закрытый
2.2 Знакомство с преподавателями
68
68
0м 14с
1
Закрытый
2.3 Расписание стажировки
65
65
2м 6с
2
Закрытый
2.4 Вводное тестирование. Часть 1.
67
61
3м 53с
1
Закрытый
2.5 Вводное тестирование. Часть 2.
68
59
7м 9с
2
Закрытый
2.6 Вебинар 1. Организационный
67
67
0м 5с
6

3. Введение в проектную работу

4 урока
Закрытый
3.1 Как строится работа в команде на стажировке + теория GIT
67
55
11м 55с
4
Закрытый
3.2 Кто и почему проверяет задания?
64
64
1м 6с
2
Закрытый
3.3 Вебинар 2. Создание GIT репозитория и проверка задач
65
65
0м 5с
1
Закрытый
3.4 Задание. Создание личных и командных репозиториев
64
50
58м 22с
3

4. Работа с базами данных

10 уроков
Закрытый
4.1 Образ, который нам понадобится
66
48
4м 5с
2
Закрытый
4.2 Задание. Работа с PostgreSQL
59
23
208м 42с
1
Закрытый
4.3 Задание. Работа с Clickhouse
59
29
9м 6с
2
Закрытый
4.4 Самостоятельные задания на определение движка таблиц
23
7
0м 28с
0
Закрытый
4.5 Вебинар 3. Обсуждаем задачи PG и CH
59
59
0м 6с
3
Закрытый
4.6 Что такое NoSQL и в чем его суть?
50
34
16м 59с
1
Закрытый
4.7 Задание. Работа с NoSQL
54
22
-
1
Закрытый
4.8 Репликация NoSQL
19
19
2м 21с
0
Закрытый
4.9 Работа с Trino
19
15
5м 16с
0
Закрытый
4.10 Вебинар 4. Обсуждаем задачи NoSQL
59
59
0м 6с
0

5. Потоковая обработка данных + настройка алертов

6 уроков
Закрытый
5.1 Введение в streaming
47
30
32м 38с
0
Закрытый
5.2 Задание. Kafka против дубликатов
45
22
226м 30с
0
Закрытый
5.3 Аларм!
39
30
11м 29с
0
Закрытый
5.4 Что такое Debezium?
40
26
22м 10с
0
Закрытый
5.5 Stateful и Stateless. Введение в Spark Streaming
37
25
24м 28с
1
Закрытый
5.6 Вебинар 5. Обсуждаем задачи Kafka
43
43
0м 6с
0

6. Батчовая обработка данных + настройка grafana

6 уроков
Закрытый
6.1 Что такое HDFS? Особенности.
36
24
22м 10с
0
Закрытый
6.2 Самостоятельное задание на работу с HDFS/BASH
14
14
2м 5с
0
Закрытый
6.3 Объектные хранилища: что это и как с ними работать?
32
25
16м 54с
0
Закрытый
6.4 Создание дашбордов Grafana и основные метрики проверки данных
33
21
22м 51с
0
Закрытый
6.5 Задание. Объектное хранилище - расширение функционала клиента.
35
11
-
0
Закрытый
6.6 Вебинар 6. Строим ETL процессы и настраиваем мониторинг
38
38
0м 12с
0

7. Работа с инструментами Big Data

13 уроков
Закрытый
7.1 Что такое Hive? Особенности
34
24
28м 1с
1
Закрытый
7.2 Что такое Iceberg? Slowly Changing Dimensions.
33
24
25м 59с
0
Закрытый
7.3 Вебинар 7. Работаем с HDFS/HIVE
40
40
0м 5с
0
Закрытый
7.4 Установка Spark, архитектура и структуры
34
24
23м 22с
2
Закрытый
7.5 Что такое преобразования в RDD?
30
22
8м 1с
0
Закрытый
7.6 Что такое действия в RDD?
28
19
19м 18с
0
Закрытый
7.7 Что такое преобразования и действия в Dataframe?
27
19
16м 51с
0
Закрытый
7.8 SparkSQL on Dataframes
27
17
8м 18с
0
Закрытый
7.9 Вебинар 8. Работаем с PySparkSQL
36
36
0м 5с
0
Закрытый
7.10 Работа с функциями PySpark
30
18
12м 30с
0
Закрытый
7.11 Практика PySpark
29
15
5м 33с
0
Закрытый
7.12 Задание. Финалим работу с PySpark
33
11
-
0
Закрытый
7.13 Вебинар 9. Работаем с PySpark
31
31
0м 7с
0

8. Практическое изучение Airflow

7 уроков
Закрытый
8.1 Введение в оркестрацию данных!
34
25
16м 45с
0
Закрытый
8.2 Что такое переменные и таски? Виды тасок
29
23
24м 40с
1
Закрытый
8.3 Что такое connections, xcom, sensors?
31
22
16м 17с
-1
Закрытый
8.4 Вебинар 10. Практика Airflow
34
34
0м 7с
0
Закрытый
8.5 Задание. Реализация генератора DAGs
31
8
-
0
Закрытый
8.6 Миграция больших данных
30
30
0м 25с
0
Закрытый
8.7 Вебинар 11. Задача миграции
33
33
0м 5с
0

9. Знакомство с парсингом, очистка и загрузка данных

6 уроков
Закрытый
9.1 Парсинг: введение
30
25
4м 2с
0
Закрытый
9.2 Requests, BeautifulSoup
28
15
15м 34с
0
Закрытый
9.3 Задание. Разработка простого парсера.
21
8
-
0
Закрытый
9.4 Scrapy, Selenium
21
10
5м 37с
0
Закрытый
9.5 Задание. Разработка продвинутого парсера.
22
3
-
0
Закрытый
9.6 Вебинар 12. Парсинг
24
24
0м 7с
0

10. Реализация итогового проекта и его защита

5 уроков
Закрытый
10.1 Резюмируем вышесказанное
32
25
5м 35с
0
Закрытый
10.2 Вебинар 13. Обсуждение заданий итоговых проектов
32
32
0м 6с
0
Закрытый
10.3 Закрытый итоговый проект №1. Пикча
33
5
37м 47с
0
Закрытый
10.4 Открытый итоговый проект №2. Система миграции данных
31
31
2м 58с
0
Закрытый
10.5 Вебинар 14. Публичная защита проектов
31
31
0м 9с
0

11. Дальнейшее трудоустройство

1 урок
Закрытый
11.1 Вебинар 15. Обсуждение трудоустройства
26
26
0м 7с
0