Чему вы научитесь
- • превращать реальную проблему в понятную задачу анализа данных;
- • разбираться в таблицах, текстах, изображениях, графах и других типах данных;
- • проверять качество данных и замечать пропуски, ошибки, выбросы и подозрительные результаты;
- • исследовать данные с помощью визуализаций, статистики и компьютерных симуляций;
- • применять линейную и логистическую регрессию, классификацию, кластеризацию и анализ текстов;
- • строить модели на реальных примерах: от медицины и бизнеса до исторических расследований;
- • оценивать качество моделей и понимать, почему высокая точность ещё не означает хорошее исследование;
- • распознавать статистические ловушки, ложные корреляции, утечки данных и другие способы красиво ошибиться;
- • работать в Orange и собирать полноценный анализ без сложного программирования;
- • использовать искусственный интеллект для поиска идей, подготовки данных, объяснения моделей и проверки выводов — но не позволять ему думать вместо вас 🤖;
- • представлять результаты так, чтобы их поняли не только аналитики, но и обычные люди;
- • проходить весь путь анализа данных: от первого вопроса «Покажите ваши данные» до обоснованного решения и готового проекта.
- Мы будем не просто изучать методы, а применять их, экспериментировать, спорить с моделями, попадать в ловушки и учиться из них. Иногда серьёзно, иногда с юмором, но всегда по-настоящему 📊
О курсе
Для кого этот курс
Начальные требования
Для начала курса вам понадобятся:
- любознательность и желание понять, что на самом деле скрывается за цифрами;
- стремление докопаться до истины, даже если первый вывод выглядит слишком красивым;
- готовность задавать вопросы, сомневаться и проверять ответы;
- смелость вступить в бой с пропусками, ошибками, выбросами и другими представителями мира грязных данных 🧹;
- желание экспериментировать, строить гипотезы и учиться на ошибках;
- любовь к людям, природе и окружающему миру, потому что данные становятся важными только тогда, когда помогают понять реальность и сделать её немного лучше 🌍.
Знание программирования и сложной математики не требуется. Достаточно уверенно пользоваться компьютером и быть готовым думать. Всё остальное мы постепенно освоим вместе.
Преподаватели курса
Как проходит обучение
Курс можно проходить в двух форматах.
Живые занятия по субботам
Каждую субботу мы встречаемся онлайн и вместе разбираем новую тему. На занятиях будут объяснения, демонстрации в Orange, реальные примеры, компьютерные симуляции, вопросы, небольшие расследования и практические задания.
Можно задавать вопросы преподавателю, обсуждать неожиданные результаты и вместе искать, где данные пытаются нас обмануть 📊
Обучение в записи
Все занятия будут доступны в записи. Вы сможете смотреть их в удобное время, ставить видео на паузу, возвращаться к сложным моментам и проходить курс в собственном темпе.
На Stepik будут размещены материалы уроков, задания, тесты, наборы данных и дополнительные примеры. Поэтому присоединиться к курсу можно даже тогда, когда вы не можете присутствовать на живых занятиях.
Оба формата ведут по одной программе: объяснение → пример → практика → проверка понимания → применение к реальной задаче. Можно участвовать в прямых эфирах, учиться только по записям или совмещать оба варианта.
Что вы получите
- После записи на курс вы получите:
- доступ к живым занятиям по субботам и возможность задавать вопросы;
- записи всех занятий, чтобы учиться в удобное время и возвращаться к сложным моментам;
- структурированную программу на Stepik с материалами, тестами и практическими заданиями;
- реальные наборы данных из медицины, бизнеса, истории, социальных сетей и повседневной жизни;
- готовые схемы работы в Orange Data Mining, которые можно повторять, изменять и применять к своим задачам;
- компьютерные симуляции, интерактивные примеры и небольшие исследования;
- практику работы с визуализациями, статистикой, регрессией, классификацией, кластеризацией и анализом текстов;
- разбор статистических ловушек, ложных закономерностей и других способов уверенно прийти к совершенно неправильному выводу;
- навыки грамотного использования ИИ: от поиска идеи до проверки и объяснения результата 🤖;
- задания и мини-проекты, которые помогут пройти весь путь от грязных данных до обоснованных выводов;
- общение с другими участниками, совместные обсуждения, вопросы и поиск решений;
- объяснения, истории и фирменные шутки доктора Игоря — потому что анализ данных может быть серьёзным, но не обязан быть скучным 😄.