Курс на Stepik
Обложка курса «Big Data for Data Science» на Stepik
20 000 ₽

Big Data for Data Science 4.700

Открыть на
STEPIK.ORG

Программа знакомит слушателей с основами которые применяются при работе с Большими данными и рассчитан в первую очередь на тех слушателей, которые только начинают свой путь в Big Data. Мы подробно разберем основные теоретические понятия, начнем знакомство со Spark — наиболее популярным фреимворком из этого мира, а также изучим как это можно применять при реализации распределенных моделей машинного обучения. А в ходе выполнения проектного задания разберем все этапы, которые проходят данные в реальных системах.

Показатель Текущие показатели Рост
Значение 🏆 Рейтинг 3 дн 7 дн 30 дн
Количество учеников на курсе «Big Data for Data Science»Учеников на курсе 442
Сертификаты, выданные на курсе «Big Data for Data Science»Сертификатов выдано 74
Отзывы о курсе «Big Data for Data Science»Отзывов получено 10
Рейтинг курса «Big Data for Data Science»Рейтинг курса 4.700
Уроки в курсе «Big Data for Data Science»Количество уроков 52
Тесты в курсе «Big Data for Data Science»Количество квизов 137
Задачи с кодом в курсе «Big Data for Data Science»Количество задач с кодом 10
Время прохождения курса «Big Data for Data Science»Время прохождения курса
Стоимость курса «Big Data for Data Science»Стоимость курса 20 000 ₽
Обновления курса «Big Data for Data Science»Обновления курса
Дата публикации курса «Big Data for Data Science»Дата публикации курса
Последнее обновление курса «Big Data for Data Science»Последнее обновление
Сложность easy

Чему вы научитесь

Этот курс — программа проекта Stepik Academy. Перед покупкой посмотрите, пожалуйста, информацию и программу на сайте проекта.

В повседневной жизни мы пользуемся самыми разнообразными цифровыми устройствами, и каждый из нас генерирует огромные объемы информации за свою жизнь. И для хранения и обработки такого объема информации созданы специальные технологии которые любят называть таинственным словом Big Data.

Специалистам в сфере науки о данных так или иначе приходится работать со специальными хранилищами и технологиями, используемыми для хранения и обработки больших данных.

В данном курсе мы познакомимся с технологиями из мира больших данных, рассмотрим, как их можно применять для обработки данных и в машинном обучении. Рассмотрим и изучим процессы параллельной и распределенной обработки больших объемов данных.

Разберемся, как работают системы для хранения больших данных, рассмотрим основные принципы обработки таких объемов данных.
Познакомимся с фреймворками Hadoop, Spark, Airflow, специальными хранилищами данных HDFS, ClickHouse, а так же с BI инструментом SuperSet.
Изучим работу распределенного машинного обучения и его применение с использованием модуля SparkML.

Мы будем решать практические задания на языках Python и SQL, поэтому вам потребуется навыки программирования на базовом уровне.

О курсе

Программа знакомит слушателей с основами которые применяются при работе с Большими данными и рассчитан в первую очередь на тех слушателей, которые только начинают свой путь в Big Data. Мы подробно разберем основные теоретические понятия, начнем знакомство со Spark — наиболее популярным фреимворком из этого мира, а также изучим как это можно применять при реализации распределенных моделей машинного обучения. А в ходе выполнения проектного задания разберем все этапы, которые проходят данные в реальных системах.

Для кого этот курс

Специалисты Data Science и все те кто хочет познакомится с Big Data, а также узнать как применяются эти технологии для хранения, обработки данных и в машинном обучении.

Начальные требования

Базовые знания языка Python и SQL.

Преподаватели курса

Сертификат курса Big Data for Data Science

Сертификат

Успешно завершив курс, вы получите сертификат от платформы Stepik. Уже 74 учеников получили сертификат.

Нагрузка

Нагрузка: 6-10 часов в неделю Время прохождения курса: 60 часов

Расскажите о курсе друзьям