Курс на Stepik
Обложка курса «Computer Vision Engineer: от детекции и Doc-AI до продакшна» на Stepik
19 990 ₽

Computer Vision Engineer: от детекции и Doc-AI до продакшна 5.000

Открыть на
STEPIK.ORG

Практический курс по Computer Vision. Соберёте продакшн-сервис: датасет → обучение (YOLO/RT-DETR, SAM), трекинг, OCR/Doc-AI, веб-приложение (UI+API) и мониторинг. Экспорт в ONNX/TensorRT/OpenVINO, батчинг/квантование под CPU/GPU. Плюс профессиональные блоки: mAP/IoU/Dice и калибровка доверия, QA разметки и аугментации, p95/стоимость, дрейф данных и алерты, guardrails (NMS/правила), A/B-тесты, Triton/gRPC/FastAPI.

Показатель Текущие показатели Рост
Значение 🏆 Рейтинг 3 дн 7 дн 30 дн
Количество учеников на курсе «Computer Vision Engineer: от детекции и Doc-AI до продакшна»Учеников на курсе 59
Сертификаты, выданные на курсе «Computer Vision Engineer: от детекции и Doc-AI до продакшна»Сертификатов выдано 0
Отзывы о курсе «Computer Vision Engineer: от детекции и Doc-AI до продакшна»Отзывов получено 1
Рейтинг курса «Computer Vision Engineer: от детекции и Doc-AI до продакшна»Рейтинг курса 5.000
Уроки в курсе «Computer Vision Engineer: от детекции и Doc-AI до продакшна»Количество уроков 60
Тесты в курсе «Computer Vision Engineer: от детекции и Doc-AI до продакшна»Количество квизов 605
Время прохождения курса «Computer Vision Engineer: от детекции и Doc-AI до продакшна»Время прохождения курса
Стоимость курса «Computer Vision Engineer: от детекции и Doc-AI до продакшна»Стоимость курса 19 990 ₽
Обновления курса «Computer Vision Engineer: от детекции и Doc-AI до продакшна»Обновления курса
Дата публикации курса «Computer Vision Engineer: от детекции и Doc-AI до продакшна»Дата публикации курса
Последнее обновление курса «Computer Vision Engineer: от детекции и Doc-AI до продакшна»Последнее обновление
Сложность normal

Чему вы научитесь

  • Проектировать end-to-end пайплайн CV: сбор данных → разметка → обучение → инференс → деплой → мониторинг
  • Строить детекторы на YOLOv8/YOLO11 и RT-DETR, подбирать якоря/размеры, управлять NMS/конфиденсом
  • Применять SAM/Segment-Anything и fine-tune для продакшн-сегментации (binary/multiclass/instance)
  • Настраивать OCR/Doc-AI: PaddleOCR + LayoutParser/Detectron2 → извлечение полей → JSON → БД
  • Готовить датасеты: Label Studio/Roboflow, схемы классов, сплиты по сюжетам/камерам, стратификация
  • Проводить валидацию датасета: дубликаты, перекос классов, выбросы, «утечка» между train/val/test
  • Делать аугментации/синтетику (Albumentations, фоновые замены, RandAugment, Copy-Paste) для повышения mAP/IoU
  • Запускать обучение по рецептам: косинусный шедулер, EMA, заморозка бэкбона, mixed precision
  • Оценивать качество: mAP@[.5:.95], IoU/Dice, precision/recall, PR-кривые, калибровка вероятностей
  • Проводить error analysis: confusion-матрицы, per-class/per-area метрики, hard-examples, TTA
  • Оптимизировать инференс: экспорт в ONNX/TensorRT/OpenVINO, INT8 квантизация, fusion, dynamic shapes
  • Управлять производительностью: батчинг, пайплайн pre/post-processing, ограничение копий модели, warm-up
  • Строить сервис: FastAPI эндпоинты (sync/async), очереди Redis/RabbitMQ, rate-limit, ретраи, тайм-ауты
  • Собирать наблюдаемость: Prometheus метрики (p50/p95 latency, throughput, GPU/CPU/VRAM), структурированные логи
  • Настраивать алерты и дашборды (Grafana), считать cost/req и cost/1000 кадров
  • Выявлять дрейф данных/качества: pop-stats по фичам, PSI, мониторинг классов/размеров объектов
  • Деплоить в Docker/Compose; делать канареечные и блю-грин релизы, shadow-traffic, rollbacks
  • Организовывать CI/CD: линтеры, тесты инференса, проверка весов/версий, автосборки образов
  • Обеспечивать приватность и безопасность: маскирование лиц/номеров, PII-политики, аудит доступа
  • Документировать сервис (OpenAPI), готовить отчёты по метрикам для бизнеса и ROMI-скелеты
  • Оформлять проекты в портфолио: репозиторий с Makefile/README, скрипты во

О курсе

Практический курс по Computer Vision. Соберёте продакшн-сервис: датасет → обучение (YOLO/RT-DETR, SAM), трекинг, OCR/Doc-AI, веб-приложение (UI+API) и мониторинг. Экспорт в ONNX/TensorRT/OpenVINO, батчинг/квантование под CPU/GPU. Плюс профессиональные блоки: mAP/IoU/Dice и калибровка доверия, QA разметки и аугментации, p95/стоимость, дрейф данных и алерты, guardrails (NMS/правила), A/B-тесты, Triton/gRPC/FastAPI.

Для кого этот курс

Python-разработчики и интеграторы CCTV/ритейл/склад/пром, кому нужен измеримый бизнес-результат (качество + p95 + стоимость). Data/ML-специалисты, которые хотят довести CV-модель до продакшн-сервиса с мониторингом и алертами. Фрилансеры/аутсорс-команды, собирающие портфолио под SMB-задачи (детекция, сегментация, документы). Техлиды пилотов PoC → Prod, кому важны reproducibility, CI/CD и безопасные релизы.

Начальные требования

Обязательные:

  • Уверенный Python, Linux/Docker на базовом уровне, git, терминал.

  • Готовность следовать инструкциям по воспроизводимым окружениям (Makefile, docker-compose).

Желательно:

  • Базовый PyTorch или опыт с любым DL-фреймворком.

  • Понимание ML-метрик (precision/recall, mAP, IoU/Dice).

Преподаватели курса

Как проходит обучение

  • Каждая неделя — мини-спринт: короткая теория → примеры кода → практикум → автопроверка.

  • Практика — по готовым рабочим шаблонам: тренировка → экспорт в ONNX/OpenVINO → FastAPI-эндпоинт → метрики Prometheus. Для каждого задания есть репозиторий, инструкции make/docker-compose и эталон ожидаемых метрик.

  • Автопроверка практики: юнит-тесты инференса, проверка формата вывода/скорости, чтение /metrics (p95 latency) и контроль cost/req.

  • Данные: даём демо-датасет + чек-лист валидации для своих данных (Label Studio/Roboflow).

  • Мониторинг прогресса: после каждого спринта — отчёт метрик (качество/latency/стоимость) и чек-лист.

  • Финал — задеплоенный сервис (Docker) с дашбордом Grafana и отчётом по метрикам.

Что вы получите

  • 3 проекта-витрины (retail/defects/doc-ai) с отчётами метрик (mAP/IoU/Dice, p95, cost/req).
  • Код-скелеты: тренировка, инференс, экспорт в ONNX, FastAPI-endpoint, Dockerfile, docker-compose.
  • Шаблоны наблюдаемости: Prometheus экспортер, Grafana дашборд.
  • Валидатор датасета и чек-листы качества/скорости/стоимости.
  • CPU-трек (ONNX/OpenVINO, INT8 квантизация) — если без GPU.
  • ROMI-скелет для SMB-кейсов (как считать cost/req и обосновывать выгоду).
  • Портфолио: 3 публичных репозитория с Makefile/README и инструкциями воспроизведения.

Расскажите о курсе друзьям