Чему вы научитесь
- 1. Анализировать реальные данные NYC Taxi (1M+ записей) без сервера
- 2. Работать напрямую с CSV, Parquet и JSON: без загрузки в базу
- 3. Использовать продвинутый SQL: PIVOT, оконные функции, EXCLUDE
- 4. Подключить DuckDB к Python и интегрировать с Pandas
- 5. Исследовать любые датасеты быстро и без инфраструктуры
- 6. Применять DuckDB в реальных проектах data analytics и engineering
О курсе
Для кого этот курс
Начальные требования
☑️ базовое понимание SQL (простые SELECT-запросы, фильтрация и агрегирование)
☑️ общее представление о работе с данными (таблицы, колонки, датасеты
☑️ базовое знакомство с Python = плюс, но не обязательно: SQL-часть курса полностью автономна
☑️ компьютер с возможностью установить DuckDB и запускать SQL-запросы локально
Преподаватели курса
Как проходит обучение
⚡ Курс короткий и собран без воды: за один вечер вы установите DuckDB, напишете первые запросы, разберёте фишки SQL и примените всё на реальном датасете
📝 Короткие уроки с конкретными SQL-примерами
🔨 Практические задания после каждой темы: вы не просто
смотрите, а пишете запросы руками
📊 Работа с реальным датасетом NYC Taxi. Это те же данные,
что используют в реальных аналитических проектах
🐍 Отдельный блок по интеграции с Python и Pandas
с готовым кодом для вашего workflow
🎯 Финальный мини-проект. Небольшой, но завершённый:
анализ данных от вопроса до выводов
Сертификат
Что вы получите
- ✅ Новый рабочий инструмент для реальных аналитических задач: от исследования файлов до полноценного SQL-анализа в Python
- ✅ Умение читать CSV, Parquet и JSON напрямую, без загрузки в базу и без настройки серверов
- ✅ Готовый аналитический workflow: DuckDB + Python + Pandas -> для реальных задач
- ✅ Опыт работы с большим датасетом NYC Taxi (1M+ записей) -> можно добавить в портфолио
- ✅ Владение продвинутым SQL: PIVOT, оконные функции, EXCLUDE, REPLACE = то, чего нет в стандартных курсах по SQL
- ✅ Понимание того, когда и зачем использовать DuckDB вместо Pandas, SQLite или полноценной базы данных