Содержание курса
1. Извлечение данных
7 уроков
44
26
31м
0
Закрытый
1.1
Введение
↗
21
9
2м 36с
0
Закрытый
1.2
CSV
↗
8
3
4м 35с
0
Закрытый
1.3
JSON
↗
4
4
11м 44с
0
Закрытый
1.4
JSON (продолжение)
↗
4
4
2м 1с
0
Закрытый
1.5
XML
↗
3
2
9м 58с
0
Закрытый
1.6
Excel
↗
2
2
4м 24с
0
Закрытый
1.7
REST API
↗
2
2
-
0
2. Важность качества данных
6 уроков
10
9
8м
0
Закрытый
2.1
Quiz по извлечению данных
↗
3
2
-
0
Закрытый
2.2
Введение
↗
3
3
-
0
Закрытый
2.3
Почему качество данных важно?
↗
1
1
2м 3с
0
Закрытый
2.4
Измерение качества данных
↗
1
1
2м 43с
0
Закрытый
2.5
Реализация контроля качества на протяжении жизненного цикла
↗
1
1
2м 19с
0
Закрытый
2.6
Данные в извлечении (Data Silos)
↗
1
1
2м 16с
0
3. Профилирование данных
6 уроков
8
7
19м
0
Закрытый
3.1
Quiz по качеству данных
↗
1
1
-
0
Закрытый
3.2
Введение
↗
2
2
-
0
Закрытый
3.3
Понимание профилирования данных
↗
2
1
4м 55с
0
Закрытый
3.4
Исследование данных - Profiler против ручного EDA
↗
1
1
-
0
Закрытый
3.5
Pandas` ydata_profiling
↗
1
1
5м 11с
0
Закрытый
3.6
Profiling high volumes of data with the pandas data profiler
↗
1
1
10м 46с
0
4. Очистка неупорядоченных данных
5 уроков
6
6
16м
0
Закрытый
4.1
Введение
↗
2
2
-
0
Закрытый
4.2
Переименование столбцов
↗
1
1
10м 46с
0
Закрытый
4.3
Удаление ненужных или избыточных столбцов
↗
1
1
2м 39с
0
Закрытый
4.4
Работа с несоответствующими и неправильными типами данных
↗
1
1
2м 30с
0
Закрытый
4.5
Работа с датами и временем
↗
1
1
2м 23с
0
5. Трансформация данных
14 уроков
14
14
32м
0
Закрытый
5.1
Введение
↗
1
1
-
0
Закрытый
5.2
Объединение датасетов
↗
1
1
2м 28с
0
Закрытый
5.3
Обработка дубликатов при объединении датасетов
↗
1
1
3м 32с
0
Закрытый
5.4
Валидация данных перед объединением
↗
1
1
3м 22с
0
Закрытый
5.5
Группировка
↗
1
1
3м 42с
0
Закрытый
5.6
Агрегация
↗
1
1
3м 38с
0
Закрытый
5.7
Конкатенация
↗
1
1
2м 29с
0
Закрытый
5.8
Использование функции apply для сгруппированных данных
↗
1
1
3м 14с
0
Закрытый
5.9
Обработка дубликатов в столбцах
↗
1
1
3м 36с
0
Закрытый
5.10
Фильтрация
↗
1
1
2м 9с
0
Закрытый
5.11
Индексация
↗
1
1
2м 2с
0
Закрытый
5.12
Сортировка индексов
↗
1
1
2м 19с
0
Закрытый
5.13
Merge vs join
↗
1
1
2м 12с
0
Закрытый
5.14
Объединение DataFrame'ов
↗
1
1
2м 35с
0
6. Обработка пропущенных значений и выбросов
9 уроков
11
10
9м
0
Закрытый
6.1
Quiz по трансформации
↗
1
1
-
0
Закрытый
6.2
Quiz по Data Sinks
↗
1
1
-
0
Закрытый
6.3
Введение
↗
2
2
-
0
Закрытый
6.4
Обнаружение пропущенных значений
↗
1
1
3м 34с
0
Закрытый
6.5
Обработка пропущенных значений
↗
1
1
2м 52с
0
Закрытый
6.6
Удаление пропущенных данных
↗
1
1
2м 8с
0
Закрытый
6.7
Заполнение пропущенных данных
↗
2
1
-
0
Закрытый
6.8
Создание индикаторных переменных
↗
1
1
2м 23с
0
Закрытый
6.9
Обнаружение и обработка выбросов
↗
1
1
-
0
7. Нормализация и стандартизация
8 уроков
10
8
18м
0
Закрытый
7.1
Quiz по обработке пропущенных значений и выбросов
↗
1
1
-
0
Закрытый
7.2
Введение
↗
2
2
-
0
Закрытый
7.3
Масштабирование признаков к диапазону
↗
2
1
2м 19с
0
Закрытый
7.4
Min-max scaling
↗
1
1
4м 55с
0
Закрытый
7.5
Стандартизация
↗
1
0
3м 26с
0
Закрытый
7.6
Robust scaling
↗
1
1
3м 50с
0
Закрытый
7.7
Quantile Transformer
↗
1
1
3м 45с
0
Закрытый
7.8
Сравнение методов
↗
1
1
2м 22с
0
8. Обработка категориальных признаков
7 уроков
9
8
0м
0
Закрытый
8.1
Quiz по нормализации и стандартизации
↗
1
1
-
0
Закрытый
8.2
Введение
↗
2
2
-
0
Закрытый
8.3
Label encoding
↗
2
1
-
0
Закрытый
8.4
One-hot encoding
↗
1
1
-
0
Закрытый
8.5
Target encoding (mean encoding)
↗
1
1
-
0
Закрытый
8.6
Frequency encoding
↗
1
1
-
0
Закрытый
8.7
Binary encoding
↗
1
1
-
0
9. Временные ряды
21 урок
24
22
0м
0
Закрытый
9.1
Quiz по обработке категориальных признаков
↗
1
1
-
0
Закрытый
9.2
Введение
↗
2
2
-
0
Закрытый
9.3
Понимание компонентов временных рядов
↗
1
1
-
0
Закрытый
9.4
Анализ временных рядов
↗
1
1
-
0
Закрытый
9.5
Экспоненциальное сглаживание
↗
1
1
-
0
Закрытый
9.6
Стационарность во временных рядах
↗
1
1
-
0
Закрытый
9.7
Корреляция и автокорреляция
↗
1
1
-
0
Закрытый
9.8
Авторегрессия
↗
1
1
-
0
Закрытый
9.9
Статистические модели прогнозирования: от простого к сложному
↗
1
1
-
0
Закрытый
9.10
Статистические модели прогнозирования. Продолжение.
↗
1
1
-
0
Закрытый
9.11
Модели прогнозирования гетероскедастичности
↗
2
1
-
0
Закрытый
9.12
Валидация временных рядов
↗
1
1
-
0
Закрытый
9.13
Выявление пропущенных значений во временных рядах
↗
1
1
-
0
Закрытый
9.14
Обработка пропущенных значений во временных рядах
↗
1
1
-
0
Закрытый
9.15
Удаление пропущенных данных
↗
1
1
-
0
Закрытый
9.16
Интерполяция
↗
2
1
-
0
Закрытый
9.17
Работа с аномалиями
↗
1
1
-
0
Закрытый
9.18
Методы скользящего окна
↗
1
1
-
0
Закрытый
9.19
Инженерия признаков для временных рядов
↗
1
1
-
0
Закрытый
9.20
Дифференцирование временных рядов
↗
1
1
-
0
Закрытый
9.21
Другие методы предсказания временных рядов
↗
1
1
-
0