Чему вы научитесь
- Выбирать архитектуру: edge-only, hybrid, периодическая синхронизация
- Оценивать ограничения устройства: CPU/GPU/NPU, RAM, storage, батарея
- Выбирать формат модели и runtime: ONNX, TFLite, TensorRT и аналоги
- Применять оптимизации inference: quantization, pruning, distillation (концептуально)
- Профилировать latency и память и находить узкие места
- Проектировать энергосберегающий inference и режимы деградации
- Планировать обновления модели и rollback
- Закладывать базовые меры защиты модели и устройства
- Проектировать наблюдаемость: версии, логи, проверки качества
О курсе
Практический инженерный курс про запуск и оптимизацию нейросетей на устройствах: от выбора edge-архитектуры до профилирования latency/RAM/энергии и безопасных обновлений.
Для кого этот курс
Embedded/IoT/robotics инженеры и разработчики, которым нужно запускать ML на устройстве; ML и mobile разработчики, которым нужно доводить модели до on-device inference. Уровень: уверенный начинающий–middle.
Начальные требования
Нужны базовые навыки программирования (Python или C/C++ на уровне чтения примеров), понимание что такое модель и inference. Желательно: опыт Linux/терминала. GPU и обучение моделей не требуются.
Преподаватели курса
Как проходит обучение
В каждом уроке: контекст → инженерная логика → пример → типичные ошибки и способы проверки. Практика встроена в квизы: вы выбираете решение и получаете разбор.
Формат курса
Текстовые уроки с примерами и инженерными чек-листами + квизы на принятие решений под ограничения.
Что вы получите
- Чек-лист выбора edge vs cloud и типовых архитектур
- Шаблон профилирования: что мерить по latency/RAM/энергии
- Шпаргалка по форматам/рантаймам и их trade-offs
- Мини-набор проверок перед релизом на устройство
Нагрузка
Оценка: 3–5 часов в неделю.