Чему вы научитесь
- Понимать, как устроен веб: клиент, сервер, HTTP-запросы, статус-коды, HTML и JSON.
- Забирать страницы через requests и разбирать их с помощью BeautifulSoup.
- Находить и использовать скрытые JSON-API сайтов - часто это быстрее и надёжнее, чем парсить HTML.
- Чистить, валидировать и хранить данные: pandas, SQLite, CSV, Excel, инкрементальный сбор.
- Работать с динамическими сайтами через Playwright: клики, прокрутка, бесконечная лента, авторизация.
- Обходить блокировки этично: ротация заголовков и прокси, задержки, вежливый парсинг.
- Ускоряться через асинхронность (asyncio, aiohttp) и масштабироваться на фреймворке Scrapy.
О курсе
Практический курс по сбору данных с помощью Python. Вы научитесь автоматически извлекать информацию с сайтов и превращать её в структурированные данные для анализа и работы.
Для кого этот курс
- начинающим и практикующим Python-разработчикам
- аналитикам данных
Начальные требования
- опыт работы с Python
- уверенное владение компьютером
- базовое понимание структуры веб-сайтов
Преподаватели курса
Сертификат
Успешно завершив курс, вы получите сертификат от платформы Stepik. Уже 1 учеников получили сертификат.
Нагрузка
5-6 часов в неделю