Содержание курса
1. Введение в Big Data
2 урока
1 849
1 096
9м
42
Открытый
1.1
Что такое Big Data
↗
1 004
571
3м 54с
21
Открытый
1.2
Что такое Spark
↗
845
525
6м 46с
21
2. Spark RDD
5 уроков
2 941
1 541
56м
39
Открытый
2.1
Введение в Spark, RDD
↗
1 059
469
6м 11с
8
Открытый
2.2
Транcформации
↗
855
304
17м 56с
10
Закрытый
2.3
Действия
↗
364
285
12м 1с
9
Закрытый
2.4
Броадкастинг и аккумуляция
↗
339
291
13м 7с
8
Закрытый
2.5
Мини-проверочная работа
↗
324
192
8м 32с
4
3. Spark SQL & Введение в DF
6 уроков
1 887
1 653
34м
31
Закрытый
3.1
Знакомство с датафреймами
↗
339
289
9м 8с
11
Закрытый
3.2
Работа с DF
↗
326
275
10м 49с
6
Закрытый
3.3
Ликбез по SQL
↗
318
318
1м 23с
3
Закрытый
3.4
PySpark SQL
↗
317
261
8м 52с
4
Закрытый
3.5
Сохраняем датафреймы
↗
301
258
4м 9с
5
Закрытый
3.6
Проверочная работа
↗
286
252
1м 18с
2
4. Продвинутая работа с DF
10 уроков
2 352
2 017
71м
38
Закрытый
4.1
Мини-введение
↗
282
282
0м 25с
3
Закрытый
4.2
Состыковка с Pandas
↗
288
245
7м 35с
5
Закрытый
4.3
Работа со столбцами
↗
272
220
13м 46с
1
Закрытый
4.4
StructType, StructField
↗
243
195
10м 46с
10
Закрытый
4.5
Группировка и агрегация
↗
226
197
7м 26с
3
Закрытый
4.6
Функция pivot
↗
222
191
6м 46с
2
Закрытый
4.7
Функция join
↗
220
175
10м 31с
4
Закрытый
4.8
Мерджим датафреймы
↗
204
174
6м 57с
3
Закрытый
4.9
UDF: Применение кастомных функций
↗
203
171
9м 55с
4
Закрытый
4.10
Функция transform
↗
192
167
4м 59с
3
5. Работа с внешними источниками данных
7 уроков
1 235
1 065
37м
21
Закрытый
5.1
Работа с csv-файлами
↗
202
159
9м 26с
3
Закрытый
5.2
Работа с parquet-файлами
↗
187
159
7м 3с
2
Закрытый
5.3
Работа с JSON
↗
171
155
7м 54с
4
Закрытый
5.4
Сэмплирование
↗
177
147
5м 8с
3
Закрытый
5.5
distinct, dropDuplicated
↗
166
149
3м 59с
3
Закрытый
5.6
fill, fillna
↗
162
150
4м 39с
3
Закрытый
5.7
replace
↗
170
146
2м 47с
3
6. Репетиторство
1 урок
399
399
0м
5
Открытый
6.1
Мой контакт
↗
399
399
0м 29с
5