Чему вы научитесь
- Проектировать end-to-end пайплайн CV: сбор данных → разметка → обучение → инференс → деплой → мониторинг
- Строить детекторы на YOLOv8/YOLO11 и RT-DETR, подбирать якоря/размеры, управлять NMS/конфиденсом
- Применять SAM/Segment-Anything и fine-tune для продакшн-сегментации (binary/multiclass/instance)
- Настраивать OCR/Doc-AI: PaddleOCR + LayoutParser/Detectron2 → извлечение полей → JSON → БД
- Готовить датасеты: Label Studio/Roboflow, схемы классов, сплиты по сюжетам/камерам, стратификация
- Проводить валидацию датасета: дубликаты, перекос классов, выбросы, «утечка» между train/val/test
- Делать аугментации/синтетику (Albumentations, фоновые замены, RandAugment, Copy-Paste) для повышения mAP/IoU
- Запускать обучение по рецептам: косинусный шедулер, EMA, заморозка бэкбона, mixed precision
- Оценивать качество: mAP@[.5:.95], IoU/Dice, precision/recall, PR-кривые, калибровка вероятностей
- Проводить error analysis: confusion-матрицы, per-class/per-area метрики, hard-examples, TTA
- Оптимизировать инференс: экспорт в ONNX/TensorRT/OpenVINO, INT8 квантизация, fusion, dynamic shapes
- Управлять производительностью: батчинг, пайплайн pre/post-processing, ограничение копий модели, warm-up
- Строить сервис: FastAPI эндпоинты (sync/async), очереди Redis/RabbitMQ, rate-limit, ретраи, тайм-ауты
- Собирать наблюдаемость: Prometheus метрики (p50/p95 latency, throughput, GPU/CPU/VRAM), структурированные логи
- Настраивать алерты и дашборды (Grafana), считать cost/req и cost/1000 кадров
- Выявлять дрейф данных/качества: pop-stats по фичам, PSI, мониторинг классов/размеров объектов
- Деплоить в Docker/Compose; делать канареечные и блю-грин релизы, shadow-traffic, rollbacks
- Организовывать CI/CD: линтеры, тесты инференса, проверка весов/версий, автосборки образов
- Обеспечивать приватность и безопасность: маскирование лиц/номеров, PII-политики, аудит доступа
- Документировать сервис (OpenAPI), готовить отчёты по метрикам для бизнеса и ROMI-скелеты
- Оформлять проекты в портфолио: репозиторий с Makefile/README, скрипты во
О курсе
Для кого этот курс
Начальные требования
Обязательные:
-
Уверенный Python, Linux/Docker на базовом уровне, git, терминал.
-
Готовность следовать инструкциям по воспроизводимым окружениям (Makefile, docker-compose).
Желательно:
-
Базовый PyTorch или опыт с любым DL-фреймворком.
-
Понимание ML-метрик (precision/recall, mAP, IoU/Dice).
Преподаватели курса
Как проходит обучение
-
Каждая неделя — мини-спринт: короткая теория → примеры кода → практикум → автопроверка.
-
Практика — по готовым рабочим шаблонам: тренировка → экспорт в ONNX/OpenVINO → FastAPI-эндпоинт → метрики Prometheus. Для каждого задания есть репозиторий, инструкции
make/docker-composeи эталон ожидаемых метрик. -
Автопроверка практики: юнит-тесты инференса, проверка формата вывода/скорости, чтение
/metrics(p95 latency) и контрольcost/req. -
Данные: даём демо-датасет + чек-лист валидации для своих данных (Label Studio/Roboflow).
-
Мониторинг прогресса: после каждого спринта — отчёт метрик (качество/latency/стоимость) и чек-лист.
-
Финал — задеплоенный сервис (Docker) с дашбордом Grafana и отчётом по метрикам.
Что вы получите
- 3 проекта-витрины (retail/defects/doc-ai) с отчётами метрик (mAP/IoU/Dice, p95, cost/req).
- Код-скелеты: тренировка, инференс, экспорт в ONNX, FastAPI-endpoint, Dockerfile, docker-compose.
- Шаблоны наблюдаемости: Prometheus экспортер, Grafana дашборд.
- Валидатор датасета и чек-листы качества/скорости/стоимости.
- CPU-трек (ONNX/OpenVINO, INT8 квантизация) — если без GPU.
- ROMI-скелет для SMB-кейсов (как считать cost/req и обосновывать выгоду).
- Портфолио: 3 публичных репозитория с Makefile/README и инструкциями воспроизведения.