Сколько стоит курс « LLM - Создаем Большую Языковую Модель своими руками»?

Стоимость курса составляет 2890.00 рублей

Сколько времени занимает прохождение курса « LLM - Создаем Большую Языковую Модель своими руками»?

Прохождение курса « LLM - Создаем Большую Языковую Модель своими руками» занимает примерно 0 часов.

Какой рейтинг у курса « LLM - Создаем Большую Языковую Модель своими руками»?

Курс имеет рейтинг 0.0 из 5 на основе 0 отзывов. На курсе обучается 16 учеников.

Где можно пройти курс « LLM - Создаем Большую Языковую Модель своими руками»?

Курс доступен на образовательной платформе Stepik по адресу stepik.org/course/276236.

Курс на Stepik

Обложка курса « LLM - Создаем Большую Языковую Модель своими руками» на Stepik

2 890 ₽

LLM - Создаем Большую Языковую Модель своими руками ★ 0.000

Name: LLM - Создаем Большую Языковую Модель своими руками
Price: 2890.00 RUB
Availability: InStock
Rating: 0 (0 reviews)

Открыть на
STEPIK.ORG

Мы построим генеративный трансформер с нуля. Курс сфокусирован на минимально необходимом: от токенизации до механизма внимания, многослойного блока и цикла обучения. Цель: пройти путь от чистого листа до генерации осмысленного текста, разобрав каждый этап через код и математику. Результат: вы сами напишите модель и обучите ее. Только код и математика.

Показатель	Текущие показатели		Рост
Показатель	Значение	🏆 Рейтинг	3 дн	7 дн	30 дн
Учеников на курсе	16
Сертификатов выдано	0
Отзывов получено	0
Рейтинг курса	0.000
Количество уроков	105
Количество квизов	70
Количество задач с кодом	2
Время прохождения курса	0 ч.	—
Стоимость курса	2 890 ₽	—
Обновления курса	—	—
Дата публикации курса	2 месяца назад	—	—	—	—
Последнее обновление	12 мая 2026	—	—	—	—
Сложность	normal	—	—	—	—

Содержание курса

Разделы в курсе « LLM - Создаем Большую Языковую Модель своими руками»

14 разделов Уроки в курсе « LLM - Создаем Большую Языковую Модель своими руками»

105 уроков Тесты в курсе « LLM - Создаем Большую Языковую Модель своими руками»

70 тестов Задачи в курсе « LLM - Создаем Большую Языковую Модель своими руками»

2 задачи Время прохождения курса « LLM - Создаем Большую Языковую Модель своими руками»

0 ч.

обн. 12 мая 2026

1. Подготовка

2 урока

Открытый

1.1 Приветствие ↗

1м 10с

Открытый

1.2 Инструменты ↗

0м 28с

2. Мини-математика “скаляры, векторы, матрицы, тензоры”

4 урока

Открытый

2.1 Скаляр → Вектор → Матрица → Тензор ↗

0м 15с

Открытый

2.2 softmax и temperature ↗

Закрытый

2.3 Производная (очень упрощённо) ↗

Закрытый

2.4 Проверка знаний, закрепление материала ↗

3. Мини-курс Python “нужное для LLM”

9 уроков

0м

Закрытый

3.1 Переменные, типы, операции ↗

Закрытый

3.2 Условия и циклы (контроль потока + ошибки новичков) ↗

Закрытый

3.3 Функции ↗

Закрытый

3.4 Работа с файлами и текстом (самое важное для LLM) ↗

Закрытый

3.5 Проверка знаний, закрепление материала ↗

Закрытый

3.6 Модули и структура проекта ↗

Закрытый

3.7 NumPy минимум (таблицы/матрицы как для чисел) ↗

Закрытый

3.8 PyTorch самое нужное (тензоры + автоград) ↗

Закрытый

3.9 Проверка знаний, закрепление материала ↗

4. Введение

2 урока

Закрытый

4.1 Что такое LLM? ↗

Закрытый

4.2 Проверка знаний ↗

5. Этап 1: Токенизация - учимся работать с текстом

8 уроков

Открытый

5.1 Начало ↗

Открытый

5.2 Токенизация текста - получение идентификаторов ↗

1м 29с

Открытый

5.3 Проблема - токенов нет в словаре [UNK] ↗

Открытый

5.4 Детокенизация — пытаемся из идентификаторов получить предложение ↗

Открытый

5.5 Byte Pair Encoding (BPE) ↗

Открытый

5.6 Код. Пишем простой токенизатор ↗

Закрытый

5.7 Код. Реализация Byte-pair encoding ↗

Закрытый

5.8 Закрепляем результат, проверка знаний. ↗

6. Этап 2: Подготовка текст для обучения

6 уроков

Закрытый

6.1 Скользящее окно - генерация пар «входные данные — цель» ↗

Закрытый

6.2 Код. Создаём наш первый учебный датасет ↗

Закрытый

6.3 Код. Реализуем класс Dataset для PyTorch ↗

Закрытый

6.4 Код. Собираем всё вместе: DataLoader ↗

Закрытый

6.5 Код. Рефакторим проект ↗

Закрытый

6.6 Закрепляем результат, проверка знаний. ↗

7. Этап 3 - Векторизация токенов и кодирование позиций

4 урока

Закрытый

7.1 Векторные представления (Embeddings) ↗

Закрытый

7.2 Позиционирование векторов - Positional Encoding ↗

Закрытый

7.3 Код. Слои - TokenEmbedding, PositionalEmbedding, EmbeddingLayer ↗

Закрытый

7.4 Закрепляем результат, проверка знаний. ↗

8. Механизм Внимания без обучаемых весов

7 уроков

Закрытый

8.1 Эпоха до Внимания: RNN и LSTM и решение проблемы ↗

Закрытый

8.2 Как работает Самовнимание (Self-Attention) ↗

Закрытый

8.3 Математика. Вычисляем показатели внимания (Attention Scores) ↗

Закрытый

8.4 Математика. Нормализация через Softmax (Attention Weights) ↗

Закрытый

8.5 Математика. Вычисляем контекстные векторы ↗

Закрытый

8.6 Код. Простой пример расчета контекстного вектора ↗

Закрытый

8.7 Закрепляем результат, проверка знаний. ↗

9. Механизм Внимания - обучаемые весовые матрицы

10 уроков

0м

Закрытый

9.1 Почему нужны обучаемые веса? ↗

Закрытый

9.2 Обучаемые матрицы W_Q, W_K, W_V ↗

Закрытый

9.3 Математика с обучаемыми весами ↗

Закрытый

9.4 Математика. Шаг 1. Вычисляем Query, Key, Value ↗

Закрытый

9.5 Математика. Шаг 2. Вычисляем Attention Scores ↗

Закрытый

9.6 Математика. Шаг 3. Causal Mask - модель не должна видеть будущее ↗

Закрытый

9.7 Математика. Шаг 4. Нормализация через Softmax ↗

Закрытый

9.8 Математика. Шаг 5. Вычисляем контекстные векторы ↗

Закрытый

9.9 Сравнение: Без весов vs С весами ↗

Закрытый

9.10 Код. Механизм самовнимания с обучаемыми весами ↗

10. Multi-Head Attention

12 уроков

0м

Закрытый

10.1 Зачем нужно Multi-Head Attention? ↗

Закрытый

10.2 Архитектура Multi-Head Attention ↗

Закрытый

10.3 Математика. Шаг 1: Весовые матрицы для каждой головы ↗

Закрытый

10.4 Математика. Шаг 2: Вычисляем Q, K, V для Head 0 ↗

Закрытый

10.5 Математика. Шаг 3: Вычисляем Attention Scores для Head 0 ↗

Закрытый

10.6 Математика. Шаг 4: Softmax для Head 0 ↗

Закрытый

10.7 Математика. Шаг 5: Context Vectors для Head 0 ↗

Закрытый

10.8 Математика. Шаг 6: Вычисляем Head 1 ↗

Закрытый

10.9 Математика. Шаг 7: Объединяем головы (Concatenate) ↗

Закрытый

10.10 Математика. Шаг 8: Выходная проекция (W_O) ↗

Закрытый

10.11 Сравнение "голов" нашей модели с GPT-3 ↗

Закрытый

10.12 Код. Реализация Multi-Head Attention ↗

11. Feed-Forward Network (FFN) — добавим нейросеть

8 уроков

Закрытый

11.1 Зачем нужен Feed-Forward Network? ↗

Закрытый

11.2 Архитектура Feed-Forward Network ↗

Закрытый

11.3 Математика. Шаг 1: Весовые матрицы FFN ↗

Закрытый

11.4 Математика. Шаг 2: Первый линейный слой (Linear 1) ↗

Закрытый

11.5 Математика. Шаг 3: Функция активации ReLU ↗

Закрытый

11.6 Математика. Шаг 4: Второй линейный слой (Linear 2) ↗

Закрытый

11.7 Сравнение: Вход vs Выход FFN и с GPT-3 (175B) ↗

Закрытый

11.8 Реализация Feed-Forward Network в Python ↗

12. Transformer Block + Output Layer (Собираем всё вместе)

20 уроков

0м

Закрытый

12.1 Введение в Transformer — Революция в NLP ↗

Закрытый

12.2 Зачем вообще нужен Transformer block ↗

Закрытый

12.3 Из чего состоит Transformer block ↗

Закрытый

12.4 Как данные проходят через Transformer block ↗

Закрытый

12.5 Почему attention и FFN дополняют друг друга ↗

Закрытый

12.6 Расчеты Transformer block ↗

Закрытый

12.7 Расчеты - Output Layer (Выходной слой) ↗

Закрытый

12.8 Математика ↗

Закрытый

12.9 Математика. Шаг 1. Первая LayerNorm ↗

Закрытый

12.10 Математика. Шаг 2. Строим Q, K, V ↗

Закрытый

12.11 Математика. Шаг 3. Считаем attention scores ↗

Закрытый

12.12 Математика. Шаг 4. Применяем softmax ↗

Закрытый

12.13 Математика. Шаг 5. Получаем выход attention ↗

Закрытый

12.14 Математика. Шаг 6. Residual connection ↗

Закрытый

12.15 Математика. Шаг 7. Вторая LayerNorm ↗

Закрытый

12.16 Математика. Шаг 8. Feed-Forward Network ↗

Закрытый

12.17 Математика. Шаг 9. Второй Residual connection ↗

Закрытый

12.18 Математика. Шаг 10. Output layer ↗

Закрытый

12.19 Математика. Шаг 11. Превращаем logits в вероятности ↗

Закрытый

12.20 Код. Реализация Transformer Block ↗

13. Training Loop (Loss + Backprop + Optimizer)

9 уроков

0м

Закрытый

13.1 Введение ↗

Закрытый

13.2 Общая картина обучения ↗

Закрытый

13.3 Почему training loop — центральный механизм обучения ↗

Закрытый

13.4 Loss function ↗

Закрытый

13.5 Backpropagation ↗

Закрытый

13.6 Optimizer: кто именно двигает веса? ↗

Закрытый

13.7 Полный процесс обучения ↗

Закрытый

13.8 Математика - основные формулы ↗

Закрытый

13.9 Код. Реализация training loop ↗

14. Генерация текста. Финал

4 урока

Закрытый

14.1 Как модель начинает “говорить” ↗

Закрытый

14.2 Реализация. Шаг 1. Сохраняем лучшую модель по loss ↗

Закрытый

14.3 Реализация. Шаг 2. Генерация текста ↗

Открытый

14.4 Пробуем готовый датасет - Пьеса Шекспира ↗