Содержание курса
1. Введение
3 урока
2 462
1 466
14м
35
Открытый
1.1
Инструкция
↗
1 030
559
3м 37с
11
Открытый
1.2
Что такое LLM?
↗
732
450
6м 54с
9
Открытый
1.3
Архитектура LLM
↗
700
457
5м 2с
15
2. Токены и эмбединги
2 урока
985
256
156м
24
Открытый
2.1
Byte-Pair Encoding
↗
769
137
115м 34с
14
Закрытый
2.2
Эмбединги
↗
216
119
41м 0с
10
3. Transformer
3 урока
519
277
132м
8
Закрытый
3.1
«Внимание»
↗
199
94
101м 2с
4
Закрытый
3.2
Feed-Forward Network
↗
162
94
10м 49с
2
Закрытый
3.3
Decoder
↗
158
89
21м 14с
2
4. LLM
2 урока
324
138
173м
9
Закрытый
4.1
Собираем GPT
↗
177
79
101м 23с
5
Закрытый
4.2
Сэмплирование
↗
147
59
72м 51с
4
5. Обучение
3 урока
458
238
91м
6
Закрытый
5.1
Датасет
↗
156
67
41м 14с
3
Закрытый
5.2
Train/Eval
↗
153
56
48м 8с
1
Закрытый
5.3
Применение
↗
149
115
1м 27с
2
6. Другие модели
5 уроков
1 081
72
1008м
1
Открытый
6.1
GPT-2
↗
403
19
217м 20с
1
Открытый
6.2
LLama
↗
232
18
170м 23с
0
Открытый
6.3
Mistral
↗
149
12
324м 6с
0
Открытый
6.4
Mixtral
↗
127
12
205м 54с
0
Открытый
6.5
Gemma
↗
170
11
91м 26с
0