Содержание курса
1. Введение и архитектурный фундамент
4 урока
4
0
0м
0
Открытый
1.1
Эволюция потоковой обработки в Spark
↗
2
0
-
0
Открытый
1.2
Настройка окружения и первый pipeline
↗
1
0
-
0
Открытый
1.3
Kafka pipeline: чтение → обработка → запись
↗
0
0
-
0
Открытый
1.4
Итоговый тест и практическое задание
↗
1
0
-
0
2. Источники данных (Sources)
5 уроков
3
0
0м
0
Открытый
2.1
Источники данных: архитектура и обзор
↗
1
0
-
0
Открытый
2.2
File Source: полный pipeline
↗
1
0
-
0
Открытый
2.3
Kafka Source: продвинутая конфигурация
↗
1
0
-
0
Открытый
2.4
Десериализация: JSON, Avro, Protobuf
↗
0
0
-
0
Открытый
2.5
Источники данных: тест и задание
↗
0
0
-
0
3. Приёмники данных (Sinks)
4 урока
0
0
0м
0
Открытый
3.1
Архитектура приёмников Structured Streaming
↗
0
0
-
0
Открытый
3.2
Код: File Sink и Kafka Sink
↗
0
0
-
0
Открытый
3.3
Код: ForeachBatch и Foreach
↗
0
0
-
0
Открытый
3.4
Тест и задание: приёмники данных
↗
0
0
-
0
4. Триггеры и режимы выполнения
4 урока
0
0
0м
0
Открытый
4.1
Архитектура триггеров Structured Streaming
↗
0
0
-
0
Открытый
4.2
Код: триггеры с Kafka Source
↗
0
0
-
0
Открытый
4.3
Код: Continuous Processing с ограничениями
↗
0
0
-
0
Открытый
4.4
Тест и задание: триггеры
↗
0
0
-
0
5. Операции над потоковыми DataFrame
4 урока
0
0
0м
0
Открытый
5.1
Теория: трансформации потоковых DataFrame
↗
0
0
-
0
Открытый
5.2
Код: конвейер со сложными трансформациями
↗
0
0
-
0
Открытый
5.3
Код: конвейер дедупликации с watermark
↗
0
0
-
0
Открытый
5.4
Тест и задание: операции над потоковыми DataFrame
↗
0
0
-
0
6. Оконные функции и Event-Time обработка
5 уроков
0
0
0м
0
Открытый
6.1
Теория: оконные функции и event-time обработка
↗
0
0
-
0
Открытый
6.2
Код: Tumbling и Sliding окна с Kafka
↗
0
0
-
0
Открытый
6.3
Код: Session windows и watermarks
↗
0
0
-
0
Открытый
6.4
Код: обработка опоздавших данных с side outputs
↗
0
0
-
0
Открытый
6.5
Тест и задание: оконные функции и event-time
↗
0
0
-
0
7. Агрегации в потоке
4 урока
0
0
0м
0
Открытый
7.1
Теория агрегаций в Structured Streaming
↗
0
0
-
0
Открытый
7.2
Код: многомерные агрегации с окнами
↗
0
0
-
0
Открытый
7.3
Код: приближённые и оптимизированные агрегации
↗
0
0
-
0
Открытый
7.4
Квиз и задание: агрегации в потоке
↗
0
0
-
0
8. Joins в Structured Streaming
5 уроков
0
0
0м
0
Открытый
8.1
Теория joins в Structured Streaming
↗
0
0
-
0
Открытый
8.2
Код: stream-static join для обогащения данных
↗
0
0
-
0
Открытый
8.3
Код: stream-stream join с watermark и временными ограничениями
↗
0
0
-
0
Открытый
8.4
Квиз: joins в Structured Streaming
↗
0
0
-
0
Открытый
8.5
Задание: реализация joins в потоковом приложении
↗
0
0
-
0
9. Управление состоянием (State Management)
5 уроков
0
0
0м
0
Открытый
9.1
Теория: State Management в Spark Structured Streaming
↗
0
0
-
0
Открытый
9.2
Код: mapGroupsWithState — сессии с таймаутами
↗
0
0
-
0
Открытый
9.3
Код: flatMapGroupsWithState — конечный автомат (FSM)
↗
0
0
-
0
Открытый
9.4
Код: конфигурация RocksDB StateStore
↗
0
0
-
0
Открытый
9.5
Тест и практическое задание: State Management
↗
0
0
-
0
10. Checkpointing и отказоустойчивость
4 урока
1
0
0м
0
Открытый
10.1
Теория: Checkpointing и отказоустойчивость
↗
1
0
-
0
Открытый
10.2
Код: Pipeline с Checkpointing и мониторингом восстановления
↗
0
0
-
0
Открытый
10.3
Код: Миграция Checkpoint и Blue-Green Deployment
↗
0
0
-
0
Открытый
10.4
Quiz и практическое задание: Checkpointing
↗
0
0
-
0
11. Мониторинг, метрики и отладка
4 урока
2
0
0м
0
Открытый
11.1
Теория: мониторинг, метрики и отладка Structured Streaming
↗
1
0
-
0
Открытый
11.2
Код: StreamingQueryListener + экспорт метрик в Prometheus
↗
1
0
-
0
Открытый
11.3
Код: observe() бизнес-метрики и система алертинга
↗
0
0
-
0
Открытый
11.4
Квиз и задание: мониторинг Structured Streaming
↗
0
0
-
0
12. Оптимизация производительности
4 урока
0
0
0м
0
Открытый
12.1
Теория: оптимизация производительности Structured Streaming
↗
0
0
-
0
Открытый
12.2
Код: оптимизированный Kafka-пайплайн с тюнингом
↗
0
0
-
0
Открытый
12.3
Код: профилирование производительности и устранение узких мест
↗
0
0
-
0
Открытый
12.4
Квиз и задание: оптимизация производительности
↗
0
0
-
0
13. Тестирование потоковых приложений
4 урока
0
0
0м
0
Открытый
13.1
Стратегия тестирования потоковых приложений
↗
0
0
-
0
Открытый
13.2
Практика: Unit-тесты с MemoryStream
↗
0
0
-
0
Открытый
13.3
Практика: Интеграционные тесты с TestContainers и Kafka
↗
0
0
-
0
Открытый
13.4
Квиз и практическое задание: Тестирование
↗
0
0
-
0
14. Production паттерны и архитектура
4 урока
0
0
0м
0
Открытый
14.1
Production паттерны потоковых приложений
↗
0
0
-
0
Открытый
14.2
Практика: Multi-query, DLQ и Graceful Shutdown
↗
0
0
-
0
Открытый
14.3
Практика: CDC-pipeline обработки изменений
↗
0
0
-
0
Открытый
14.4
Квиз и практическое задание: Production паттерны
↗
0
0
-
0
15. Интеграция с экосистемой
4 урока
0
0
0м
0
Открытый
15.1
Экосистема: Delta Lake, Iceberg, Hudi и оркестрация
↗
0
0
-
0
Открытый
15.2
Практика: Delta Lake streaming pipeline с MERGE
↗
0
0
-
0
Открытый
15.3
Практика: Iceberg streaming pipeline
↗
0
0
-
0
Открытый
15.4
Квиз и практическое задание: Экосистема
↗
0
0
-
0
16. Запись стримингом в ClickHouse
14 уроков
5
0
0м
0
Открытый
16.1
Обзор ClickHouse как target для streaming
↗
1
0
-
0
Открытый
16.2
JDBC через ForeachBatch
↗
1
0
-
0
Открытый
16.3
HTTP Interface через ForeachBatch
↗
1
0
-
0
Открытый
16.4
Официальный Spark ClickHouse Connector
↗
1
0
-
0
Открытый
16.5
Kafka → ClickHouse Kafka Engine
↗
0
0
-
0
Открытый
16.6
Промежуточные файлы: S3/HDFS → ClickHouse
↗
0
0
-
0
Открытый
16.7
Промежуточные файлы: S3/HDFS → ClickHouse
↗
0
0
-
0
Открытый
16.8
Промежуточные файлы: S3/HDFS → ClickHouse
↗
0
0
-
0
Открытый
16.9
Промежуточные файлы: S3/HDFS → ClickHouse
↗
0
0
-
0
Открытый
16.10
Промежуточные файлы: S3/HDFS → ClickHouse
↗
0
0
-
0
Открытый
16.11
Промежуточные файлы: S3/HDFS → ClickHouse
↗
0
0
-
0
Открытый
16.12
Native Protocol через clickhouse-java
↗
0
0
-
0
Открытый
16.13
Сравнительная таблица методов
↗
1
0
-
0
Открытый
16.14
Quiz и практическое задание: Kafka → Spark → ClickHouse
↗
0
0
-
0