Содержание курса
1. Первые действия
2 урока
134
128
17м
5
Закрытый
1.1
Купили, что дальше?
↗
67
61
17м 33с
5
Закрытый
1.2
Телеграмм каналы
↗
67
67
0м 10с
0
2. Организация работы
6 уроков
399
386
13м
30
Закрытый
2.1
Цели стажировки
↗
67
67
1м 25с
5
Закрытый
2.2
Знакомство с преподавателями
↗
67
67
0м 15с
5
Закрытый
2.3
Расписание стажировки
↗
67
67
2м 9с
6
Закрытый
2.4
Вводное тестирование. Часть 1.
↗
67
58
3м 47с
4
Закрытый
2.5
Вводное тестирование. Часть 2.
↗
65
61
7м 43с
4
Закрытый
2.6
Вебинар | Первые действия и организация работы
↗
66
66
0м 3с
6
3. Введение в проектную работу
4 урока
257
221
25м
11
Закрытый
3.1
Как строится работа в команде на стажировке + теория GIT
↗
65
53
19м 0с
4
Закрытый
3.2
Кто и почему проверяет задания?
↗
62
62
1м 6с
3
Закрытый
3.3
Вебинары | Введение в проектную работу
↗
64
61
0м 17с
0
Закрытый
3.4
Задание. Создание личных и командных репозиториев
↗
66
45
5м 6с
4
4. Работа с базами данных
10 уроков
520
425
63м
0
Закрытый
4.1
Образ, который нам понадобится
↗
60
51
4м 2с
0
Закрытый
4.2
Задание. Работа с PostgreSQL
↗
59
39
14м 3с
0
Закрытый
4.3
Задание. Работа с Clickhouse
↗
52
34
21м 5с
0
Закрытый
4.4
Самостоятельные задания на определение движка таблиц
↗
48
39
2м 57с
0
Закрытый
4.5
Вебинары | Работа с базами данных
↗
58
54
0м 15с
0
Закрытый
4.6
Что такое NoSQL и в чем его суть?
↗
46
36
15м 51с
0
Закрытый
4.7
Задание. Работа с NoSQL
↗
50
28
-
0
Закрытый
4.8
Репликация NoSQL
↗
47
47
2м 21с
0
Закрытый
4.9
Работа с Trino
↗
46
43
5м 39с
0
Закрытый
4.10
Вебинар | Работа с базами данных
↗
54
54
0м 3с
0
5. Потоковая обработка данных + настройка алертов
6 уроков
253
194
73м
0
Закрытый
5.1
Введение в streaming
↗
44
38
28м 58с
0
Закрытый
5.2
Задание. Kafka против дубликатов
↗
44
26
-
0
Закрытый
5.3
Аларм!
↗
42
33
15м 20с
0
Закрытый
5.4
Что такое Debezium?
↗
40
31
14м 54с
0
Закрытый
5.5
Stateful и Stateless. Введение в Spark Streaming
↗
38
25
16м 32с
0
Закрытый
5.6
Вебинары | Обсуждение задач Kafka
↗
45
41
0м 10с
0
6. Батчевая обработка данных + настройка grafana
6 уроков
204
148
93м
0
Закрытый
6.1
Что такое HDFS? Особенности.
↗
36
26
48м 52с
0
Закрытый
6.2
Самостоятельное задание на работу с HDFS/BASH
↗
32
32
2м 5с
0
Закрытый
6.3
Объектные хранилища: что это и как с ними работать?
↗
33
28
26м 29с
0
Закрытый
6.4
Создание дашбордов Grafana и основные метрики проверки данных
↗
33
19
17м 42с
0
Закрытый
6.5
Задание. Объектное хранилище - расширение функционала клиента.
↗
35
12
-
0
Закрытый
6.6
Вебинары | Строим ETL процессы и настраиваем мониторинг
↗
35
31
0м 9с
0
7. Работа с инструментами Big Data
13 уроков
366
298
189м
0
Закрытый
7.1
Что такое Hive? Особенности
↗
33
25
31м 21с
0
Закрытый
7.2
Что такое Iceberg? Slowly Changing Dimensions.
↗
30
24
12м 54с
0
Закрытый
7.3
Вебинар | Работаем с HDFS/HIVE
↗
33
33
0м 5с
0
Закрытый
7.4
Установка Spark, архитектура и структуры
↗
29
23
43м 52с
0
Закрытый
7.5
Что такое преобразования в RDD?
↗
24
23
11м 23с
0
Закрытый
7.6
Что такое действия в RDD?
↗
25
22
19м 18с
0
Закрытый
7.7
Что такое преобразования и действия в Dataframe?
↗
23
21
22м 11с
0
Закрытый
7.8
SparkSQL on Dataframes
↗
24
21
13м 25с
0
Закрытый
7.9
Вебинар | Работаем с PySparkSQL
↗
32
32
0м 2с
0
Закрытый
7.10
Работа с функциями PySpark
↗
25
22
31м 25с
0
Закрытый
7.11
Практика PySpark
↗
26
15
5м 17с
0
Закрытый
7.12
Задание. Финалим работу с PySpark
↗
31
12
-
0
Закрытый
7.13
Вебинары | Работаем с PySpark
↗
31
25
0м 12с
0
8. Практическое изучение Airflow
7 уроков
181
139
121м
0
Закрытый
8.1
Введение в оркестрацию данных!
↗
30
21
15м 38с
0
Закрытый
8.2
Что такое переменные и таски? Виды тасок
↗
22
18
78м 58с
0
Закрытый
8.3
Что такое connections, xcom, sensors?
↗
22
16
28м 56с
0
Закрытый
8.4
Вебинары | Практика Airflow
↗
27
25
0м 11с
0
Закрытый
8.5
Задание. Реализация генератора DAGs
↗
28
7
-
0
Закрытый
8.6
Миграция больших данных
↗
22
22
0м 25с
0
Закрытый
8.7
Вебинар | Задача миграции
↗
30
30
0м 4с
0
9. Знакомство с парсингом, очистка и загрузка данных
6 уроков
127
63
39м
0
Закрытый
9.1
Парсинг: введение
↗
26
19
7м 54с
0
Закрытый
9.2
Requests, BeautifulSoup
↗
21
11
31м 22с
0
Закрытый
9.3
Задание. Разработка простого парсера.
↗
22
6
-
0
Закрытый
9.4
Scrapy, Selenium
↗
13
6
0м 22с
0
Закрытый
9.5
Задание. Разработка продвинутого парсера.
↗
24
4
-
0
Закрытый
9.6
Вебинары | Парсинг
↗
21
17
0м 10с
0
10. Реализация итогового проекта и его защита
5 уроков
124
91
44м
0
Закрытый
10.1
Резюмируем вышесказанное
↗
26
19
5м 24с
0
Закрытый
10.2
Вебинар | Обсуждение заданий итоговых проектов
↗
24
24
0м 3с
0
Закрытый
10.3
Закрытый итоговый проект №1. Пикча
↗
27
1
37м 47с
0
Закрытый
10.4
Открытый итоговый проект №2. Система миграции данных
↗
23
23
2м 1с
0
Закрытый
10.5
Вебинар | Публичная защита проектов
↗
24
24
-
0
11. Дальнейшее трудоустройство
1 урок
2
2
0м
0
Закрытый
11.1
Вебинар | Обсуждение трудоустройства
↗
2
2
-
0
12. Инженерный модуль
2 урока
7
3
0м
0
Закрытый
12.1
Что такое VM, Docker
↗
3
1
-
0
Закрытый
12.2
Что такое K8S?
↗
4
2
-
0
13. Основы DBT
9 уроков
9
3
0м
0
Закрытый
13.1
Что такое DBT
↗
2
1
-
0
Закрытый
13.2
Установка dbt
↗
1
1
-
0
Закрытый
13.3
Основные команды dbt
↗
1
1
-
0
Закрытый
13.4
Промежуточное тестирование
↗
3
0
-
0
Закрытый
13.5
Jinja-шаблонизация
↗
1
0
-
0
Закрытый
13.6
Jinja часть 2
↗
0
0
-
0
Закрытый
13.7
Jinja часть 3
↗
0
0
-
0
Закрытый
13.8
Оптимизация
↗
1
0
-
0
Закрытый
13.9
Итоговое задание
↗
0
0
-
0
14. Основы работы с Data Science
4 урока
8
0
0м
0
Закрытый
14.1
Что такое AI/ML/DL? Зачем дата инженеру это знать?
↗
2
0
-
0
Закрытый
14.2
Знакомство с FeatureStore
↗
2
0
-
0
Закрытый
14.3
Знакомство с MLflow
↗
2
0
-
0
Закрытый
14.4
Как нейросети могут помочь DE, а в каком случае только навредят?
↗
2
0
-
0