Чему вы научитесь
- Чтение и обработка данных
- Научитесь загружать и просматривать данные из CSV, Excel, JSON. Работа с большими файлами через chunksize, пропусками и базовой очисткой.
- Манипуляции с данными
- Освоите фильтрацию, сортировку, группировку и оптимизацию памяти. Работа с дубликатами, заменой значений и индексами.
- Объединение и агрегация
- Научитесь объединять таблицы (merge, join, concat) и применять агрегирующие функции: среднее, сумма и др.
- Работа с датами
- Преобразование строк в даты, извлечение компонентов времени и анализ временных рядов.
- Визуализация и выборка
- Создание графиков, выборка по меткам и позициям (.loc, .iloc), визуальный анализ данных.
- Подготовка к ML
- Масштабирование, нормализация, кодирование категорий (One-Hot, Label) для машинного обучения.
О курсе
Этот курс позволит вам освоить ключевые концепции и методы работы с Pandas, которые будут полезны в различных аналитических задачах и проектах. Вы также приобретете практические навыки через выполнение упражнений.
Для кого этот курс
Школьники и студенты, которые хотят уверенно работать с данными для проектов, учебы и олимпиад.
Начинающие аналитики, которым важно научиться быстро загружать, очищать и анализировать данные.
Data scientists, стремящиеся улучшить навыки предобработки, создания признаков и подготовки данных к моделям.
Разработчики машинного обучения, которым важно уметь обрабатывать выбросы, кодировать признаки и масштабировать данные.
Финансовые аналитики, которые хотят анализировать временные ряды, тренды и рыночные показатели.
Веб-разработчики, работающие с данными в реальном времени, API и отчётами прямо в приложении.
Начальные требования
Для изучения Pandas достаточно базовых знаний Python: понимание списков, словарей, функций и циклов. Также пригодится опыт работы в Jupyter или Google Colab. Даже если вы новичок, интерфейс Pandas прост и освоить его несложно!
Преподаватели курса
Как проходит обучение
Вы будете изучать теорию через понятные текстовые лекции, а закреплять знания — с помощью практических заданий на реальных датасетах. Много практики, разборов и реальных кейсов — всё, чтобы вы быстро перешли от теории к действию.
Сертификат
Успешно завершив курс, вы получите сертификат от платформы Stepik. Уже 20 учеников получили сертификат.
Что вы получите
- Практические навыки работы с библиотекой Pandas, востребованные на рынке труда
- Опыт анализа и обработки данных на реальных примерах
- Уверенность в работе с табличными данными и временными рядами
- Подготовку данных для машинного обучения
- Сертификат о прохождении курса, подтверждающий вашу квалификацию
Нагрузка
4-5 часов в неделю