Чему вы научитесь
- чистить строки и собирать записи;
- работать со списками словарей;
- читать CSV и JSON;
- разбирать даты, timezone offset и денежные поля;
- ловить дубли, пропуски и кривые значения;
- собирать маленький pipeline обработки данных.
О курсе
Курс для тех, кто уже знает базовый Python и хочет перейти от учебных упражнений к нормальной работе с записями, файлами, датами и маленькими batch-наборами данных.
Для кого этот курс
Ты уже знаешь базовый Python: строки, списки, словари, if, for, функции и import.
Хочешь перейти от учебных задач к обработке данных.
Работаешь аналитиком, junior data-специалистом или заходишь в DE-практику.
Ищешь практику с CSV, JSON и batch-кейсами, а не еще один курс про синтаксис.
Начальные требования
- ты спокойно работаешь в Python со строками, списками, словарями и множествами;
- умеешь писать короткие функции и простые циклы;
- не теряешься от import и стандартной библиотеки;
- готов читать условие, писать код и руками проверять результат.
Что желательно, но не обязательно:
- общее понимание, что такое запись, batch, дубликат, агрегация;
- SQL на базовом уровне;
- интерес к DE или ETL-задачам.
Что не требуется:
- pandas;
- ООП;
- asyncio;
- API;
- Airflow;
- production-опыт.
Преподаватели курса
Как проходит обучение
Формат курса практический:
- короткий текстовый шаг;
- дальше Python code-задачи в Stepik;
- в нужных местах dataset-шаг с CSV или JSON;
- в конце маленький связный case.
Главный упор здесь на код и на работу руками.
Что вы получите
- После курса ты сможешь:
- уверенно писать Python для типовых задач по обработке данных;
- читать и преобразовывать сырой CSV и JSON;
- работать с датами, денежными значениями и кривыми полями;
- собирать простые transform и batch-проверки;
- понимать, как из этого вырастает следующий слой ETL-практики.