ΠšΡƒΡ€Ρ Π½Π° Stepik
ОблоТка курса «🚩 AI Security - ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΡƒΠΌ ΠΏΠΎ бСзопасности ИИ ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉΒ» Π½Π° Stepik
БСсплатно

🚩 AI Security - ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΡƒΠΌ ΠΏΠΎ бСзопасности ИИ ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ β˜… 0.000

ΠžΡ‚ΠΊΡ€Ρ‹Ρ‚ΡŒ Π½Π°
STEPIK.ORG

ΠšΡƒΡ€Ρ - Π‘TF-Ρ‡Π΅ΠΌΠΏΠΈΠΎΠ½Π°Ρ‚ - ΠΏΠΎ Π·Π°Ρ‰ΠΈΡ‚Π΅ ИИ-ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ. ΠšΠΎΡ€ΠΎΡ‚ΠΊΠ°Ρ тСория -> Атака -> Π Π°Π·Π±ΠΎΡ€ -> Π—Π°Ρ‰ΠΈΡ‚Π° Π§Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ½ΡΡ‚ΡŒ ΠΊΠ°ΠΊ ΠΈ ΠΎΡ‚ Ρ‡Π΅Π³ΠΎ Π·Π°Ρ‰ΠΈΡ‰Π°Ρ‚ΡŒ, Π½Π°Π΄ΠΎ сначала ΠΏΠΎΠΏΡ‹Ρ‚Π°Ρ‚ΡŒΡΡ ΡΠ»ΠΎΠΌΠ°Ρ‚ΡŒ ИИ ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅, Ρ‡Π΅ΠΌΡƒ ΠΈ Π±ΡƒΠ΄Π΅Ρ‚ посвящСна основная Ρ‡Π°ΡΡ‚ΡŒ курса. НСзависимо ΠΎΡ‚ Ρ‚ΠΎΠ³ΠΎ Π³Π΄Π΅ ΠΈ ΠΊΠ°ΠΊ Π²Ρ‹ создаётС своС ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅: Π±Π΅Π· ΠΊΠΎΠ΄Π° - с n8n, Π²Π°ΠΉΠ±ΠΊΠΎΠ΄ΠΈΠ½Π³ΠΎΠΌ ΠΈΠ»ΠΈ ΠΏΠΈΡˆΠΈΡ‚Π΅ вСсь ΠΊΠΎΠ΄ Ρ€ΡƒΠΊΠ°ΠΌΠΈ - курс ΠΏΠΎΠ΄ΠΎΠΉΠ΄Ρ‘Ρ‚ для любой Π°ΡƒΠ΄ΠΈΡ‚ΠΎΡ€ΠΈΠΈ.

ΠŸΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒ Π’Π΅ΠΊΡƒΡ‰ΠΈΠ΅ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΠΈ Рост
Π—Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ πŸ† Π Π΅ΠΉΡ‚ΠΈΠ½Π³ 3 Π΄Π½ 7 Π΄Π½ 30 Π΄Π½
ΠšΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ ΡƒΡ‡Π΅Π½ΠΈΠΊΠΎΠ² Π½Π° курсС «🚩 AI Security - ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΡƒΠΌ ΠΏΠΎ бСзопасности ИИ ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉΒ»Π£Ρ‡Π΅Π½ΠΈΠΊΠΎΠ² Π½Π° курсС 10
Π‘Π΅Ρ€Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ‚Ρ‹, Π²Ρ‹Π΄Π°Π½Π½Ρ‹Π΅ Π½Π° курсС «🚩 AI Security - ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΡƒΠΌ ΠΏΠΎ бСзопасности ИИ ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉΒ»Π‘Π΅Ρ€Ρ‚ΠΈΡ„ΠΈΠΊΠ°Ρ‚ΠΎΠ² Π²Ρ‹Π΄Π°Π½ΠΎ 0
ΠžΡ‚Π·Ρ‹Π²Ρ‹ ΠΎ курсС «🚩 AI Security - ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΡƒΠΌ ΠΏΠΎ бСзопасности ИИ ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉΒ»ΠžΡ‚Π·Ρ‹Π²ΠΎΠ² ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½ΠΎ 0
Π Π΅ΠΉΡ‚ΠΈΠ½Π³ курса «🚩 AI Security - ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΡƒΠΌ ΠΏΠΎ бСзопасности ИИ ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉΒ»Π Π΅ΠΉΡ‚ΠΈΠ½Π³ курса 0.000
Π£Ρ€ΠΎΠΊΠΈ Π² курсС «🚩 AI Security - ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΡƒΠΌ ΠΏΠΎ бСзопасности ИИ ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉΒ»ΠšΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ ΡƒΡ€ΠΎΠΊΠΎΠ² 13
ВСсты Π² курсС «🚩 AI Security - ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΡƒΠΌ ΠΏΠΎ бСзопасности ИИ ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉΒ»ΠšΠΎΠ»ΠΈΡ‡Π΅ΡΡ‚Π²ΠΎ ΠΊΠ²ΠΈΠ·ΠΎΠ² 68
ОбновлСния курса «🚩 AI Security - ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΡƒΠΌ ΠΏΠΎ бСзопасности ИИ ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉΒ»ΠžΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΡ курса β€” β€”
Π”Π°Ρ‚Π° ΠΏΡƒΠ±Π»ΠΈΠΊΠ°Ρ†ΠΈΠΈ курса «🚩 AI Security - ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΡƒΠΌ ΠΏΠΎ бСзопасности ИИ ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉΒ»Π”Π°Ρ‚Π° ΠΏΡƒΠ±Π»ΠΈΠΊΠ°Ρ†ΠΈΠΈ курса β€” β€”β€”β€”
ПослСднСС ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠ΅ курса «🚩 AI Security - ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΡƒΠΌ ΠΏΠΎ бСзопасности ИИ ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉΒ»ΠŸΠΎΡΠ»Π΅Π΄Π½Π΅Π΅ ΠΎΠ±Π½ΠΎΠ²Π»Π΅Π½ΠΈΠ΅ β€” β€”β€”β€”
Π‘Π»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ easy β€” β€”β€”β€”

Π§Π΅ΠΌΡƒ Π²Ρ‹ Π½Π°ΡƒΡ‡ΠΈΡ‚Π΅ΡΡŒ

  • ΠΠ°Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ уязвимости Π² LLM-прилоТСниях Ρ‡Π΅Ρ€Π΅Π· prompt injection - ΠΎΠ±Ρ…ΠΎΠ΄ инструкций, ΠΈΠ·Π²Π»Π΅Ρ‡Π΅Π½ΠΈΠ΅ систСмных ΠΏΡ€ΠΎΠΌΠΏΡ‚ΠΎΠ², манипуляция Π²Ρ‹Π²ΠΎΠ΄ΠΎΠΌ.
  • ΠžΠ±Ρ…ΠΎΠ΄ΠΈΡ‚ΡŒ safety-Ρ‚Ρ€Π΅Π½ΠΈΡ€ΠΎΠ²ΠΊΡƒ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Ρ‡Π΅Ρ€Π΅Π· jailbreak-Ρ‚Π΅Ρ…Π½ΠΈΠΊΠΈ - role-play, encoding, payload splitting, multi-turn Π°Ρ‚Π°ΠΊΠΈ.
  • ΠŸΡ€ΠΎΠ²ΠΎΠ΄ΠΈΡ‚ΡŒ indirect prompt injection - Π²Π½Π΅Π΄Ρ€ΡΡ‚ΡŒ врСдоносныС инструкции Ρ‡Π΅Ρ€Π΅Π· Π΄ΠΎΠΊΡƒΠΌΠ΅Π½Ρ‚Ρ‹, Π²Π΅Π±-страницы ΠΈ email.
  • ΠΡ‚Π°ΠΊΠΎΠ²Π°Ρ‚ΡŒ AI-Π°Π³Π΅Π½Ρ‚ΠΎΠ² ΠΈ RAG-систСмы - ΠΏΠΎΠ΄ΠΌΠ΅Π½Π° инструмСнтов, ΠΎΡ‚Ρ€Π°Π²Π»Π΅Π½ΠΈΠ΅ Π±Π°Π· Π·Π½Π°Π½ΠΈΠΉ, манипуляция Ρ†Π΅ΠΏΠΎΡ‡ΠΊΠ°ΠΌΠΈ Π²Ρ‹Π·ΠΎΠ²ΠΎΠ².
  • ΠžΡ†Π΅Π½ΠΈΠ²Π°Ρ‚ΡŒ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ Π°Ρ‚Π°ΠΊ - ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ASR, LLM-as-judge.
  • ΠŸΡ€ΠΎΠ΅ΠΊΡ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π·Π°Ρ‰ΠΈΡ‚Ρƒ - hardening систСмных ΠΏΡ€ΠΎΠΌΠΏΡ‚ΠΎΠ², guardrails, input/output Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΡ.
  • ΠšΠΎΠΌΠ±ΠΈΠ½ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Ρ‚Π΅Ρ…Π½ΠΈΠΊΠΈ - ΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΏΠΎΠ·ΠΈΡ‚Π½Ρ‹Π΅ Π°Ρ‚Π°ΠΊΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π΅ ловятся ΠΎΠ΄ΠΈΠ½ΠΎΡ‡Π½Ρ‹ΠΌΠΈ Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°ΠΌΠΈ.

О курсС

ΠšΡƒΡ€Ρ - Π‘TF-Ρ‡Π΅ΠΌΠΏΠΈΠΎΠ½Π°Ρ‚ - ΠΏΠΎ Π·Π°Ρ‰ΠΈΡ‚Π΅ ИИ-ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ. ΠšΠΎΡ€ΠΎΡ‚ΠΊΠ°Ρ тСория -> Атака -> Π Π°Π·Π±ΠΎΡ€ -> Π—Π°Ρ‰ΠΈΡ‚Π° Π§Ρ‚ΠΎΠ±Ρ‹ ΠΏΠΎΠ½ΡΡ‚ΡŒ ΠΊΠ°ΠΊ ΠΈ ΠΎΡ‚ Ρ‡Π΅Π³ΠΎ Π·Π°Ρ‰ΠΈΡ‰Π°Ρ‚ΡŒ, Π½Π°Π΄ΠΎ сначала ΠΏΠΎΠΏΡ‹Ρ‚Π°Ρ‚ΡŒΡΡ ΡΠ»ΠΎΠΌΠ°Ρ‚ΡŒ ИИ ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅, Ρ‡Π΅ΠΌΡƒ ΠΈ Π±ΡƒΠ΄Π΅Ρ‚ посвящСна основная Ρ‡Π°ΡΡ‚ΡŒ курса. НСзависимо ΠΎΡ‚ Ρ‚ΠΎΠ³ΠΎ Π³Π΄Π΅ ΠΈ ΠΊΠ°ΠΊ Π²Ρ‹ создаётС своС ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠ΅: Π±Π΅Π· ΠΊΠΎΠ΄Π° - с n8n, Π²Π°ΠΉΠ±ΠΊΠΎΠ΄ΠΈΠ½Π³ΠΎΠΌ ΠΈΠ»ΠΈ ΠΏΠΈΡˆΠΈΡ‚Π΅ вСсь ΠΊΠΎΠ΄ Ρ€ΡƒΠΊΠ°ΠΌΠΈ - курс ΠΏΠΎΠ΄ΠΎΠΉΠ΄Ρ‘Ρ‚ для любой Π°ΡƒΠ΄ΠΈΡ‚ΠΎΡ€ΠΈΠΈ.

Для ΠΊΠΎΠ³ΠΎ этот курс

ΠšΡƒΡ€Ρ ΠΏΠΎΠ΄ΠΎΠΉΠ΄Ρ‘Ρ‚ Ρ‚Π΅ΠΌ, ΠΊΡ‚ΠΎ Ρ…ΠΎΡ‡Π΅Ρ‚ Ρ€Π°Π·Π±ΠΈΡ€Π°Ρ‚ΡŒΡΡ Π² бСзопасности AI-систСм Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅, Π° Π½Π΅ ΠΏΠΎ слайдам. НС Π½ΡƒΠΆΠ½ΠΎ Π±Ρ‹Ρ‚ΡŒ программистом - достаточно ΡƒΠΌΠ΅Ρ‚ΡŒ Π΄ΡƒΠΌΠ°Ρ‚ΡŒ ΠΊΠ°ΠΊ Π°Ρ‚Π°ΠΊΡƒΡŽΡ‰ΠΈΠΉ, Π° ΠΈΠ½Ρ‚ΡƒΠΈΡ†ΠΈΡŽ ΠΈ Π½Π°ΡΠΌΠΎΡ‚Ρ€Π΅Π½Π½ΠΎΡΡ‚ΡŒ Π±ΡƒΠ΄Π΅ΠΌ ΠΏΡ€ΠΎΠΊΠ°Ρ‡ΠΈΠ²Π°Ρ‚ΡŒ Π² Ρ‚Π΅Ρ‡Π΅Π½ΠΈΠ΅ курса. β€” БпСциалисты ΠΏΠΎ ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΎΠ½Π½ΠΎΠΉ бСзопасности, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ хотят ΠΏΠΎΠ½ΡΡ‚ΡŒ Π½ΠΎΠ²Ρ‹ΠΉ класс ΡƒΠ³Ρ€ΠΎΠ·, связанных с LLM. β€” ΠŸΡ€ΠΎΠ΄Π°ΠΊΡ‚-ΠΌΠ΅Π½Π΅Π΄ΠΆΠ΅Ρ€Ρ‹ ΠΈ Ρ€Π°Π·Ρ€Π°Π±ΠΎΡ‚Ρ‡ΠΈΠΊΠΈ AI-ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚ΠΎΠ², ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ хотят Π΄Π΅Π»Π°Ρ‚ΡŒ свои систСмы устойчивСС ΠΊ Π°Ρ‚Π°ΠΊΠ°ΠΌ. β€” QA ΠΈ тСстировщики, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ хотят Π΄ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ adversarial testing Π² свой арсСнал. β€” ВсС, ΠΊΡ‚ΠΎ Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎ ΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ ChatGPT, Claude ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠΌΠΈ LLM ΠΈ Ρ…ΠΎΡ‡Π΅Ρ‚ ΠΏΠΎΠ½ΠΈΠΌΠ°Ρ‚ΡŒ, ΠΊΠ°ΠΊ ΠΎΠ½ΠΈ Π»ΠΎΠΌΠ°ΡŽΡ‚ΡΡ. β€” Π‘Ρ‚ΡƒΠ΄Π΅Π½Ρ‚Ρ‹ ΠΈ исслСдоватСли Π² области AI safety ΠΈ alignment, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ хотят быстро ΠΏΠΎΠ³Ρ€ΡƒΠ·ΠΈΡ‚ΡŒΡΡ Π² Π½ΠΎΠ²ΡƒΡŽ ΠΎΠ±Π»Π°ΡΡ‚ΡŒ.

ΠΠ°Ρ‡Π°Π»ΡŒΠ½Ρ‹Π΅ трСбования

Π‘Π°Π·ΠΎΠ²ΠΎΠ΅ ΠΏΠΎΠ½ΠΈΠΌΠ°Π½ΠΈΠ΅, Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ LLM (большая языковая модСль) - Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ «знаю, Ρ‡Ρ‚ΠΎ это Π½Π΅ΠΉΡ€ΠΎΡΠ΅Ρ‚ΡŒ, которая Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΠ΅Ρ‚ тСкст».

ΠžΠΏΡ‹Ρ‚ использования любой LLM (ChatGPT, Claude, Gemini ΠΈ Ρ‚.ΠΏ.) - Π½ΡƒΠΆΠ½ΠΎ ΠΏΠΎΠ½ΠΈΠΌΠ°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ ΠΏΡ€ΠΎΠΌΠΏΡ‚ ΠΈ ΠΊΠ°ΠΊ устроСн Π΄ΠΈΠ°Π»ΠΎΠ³ с модСлью.

Код ΠΏΠΈΡΠ°Ρ‚ΡŒ Π½Π΅ Π½ΡƒΠΆΠ½ΠΎ. Π’ΠΎΠΎΠ±Ρ‰Π΅. ВсС задания Ρ€Π΅ΡˆΠ°ΡŽΡ‚ΡΡ Ρ‡Π΅Ρ€Π΅Π· Ρ‡Π°Ρ‚, Ρ„ΠΎΡ€ΠΌΡ‹ ΠΈ Π·Π°Π³Ρ€ΡƒΠ·ΠΊΡƒ Ρ„Π°ΠΉΠ»ΠΎΠ².

Π—Π½Π°Π½ΠΈΠ΅ английского Π½Π° ΡƒΡ€ΠΎΠ²Π½Π΅ чтСния тСхничСских Ρ‚Π΅Ρ€ΠΌΠΈΠ½ΠΎΠ² ΠΈΠ»ΠΈ использования ΠΎΠ½Π»Π°ΠΉΠ½-ΠΏΠ΅Ρ€Π΅Π²ΠΎΠ΄Ρ‡ΠΈΠΊΠ° - Ρ‡Π°ΡΡ‚ΡŒ Π°Ρ‚Π°ΠΊ ΠΈ Ρ‚Π΅Ρ…Π½ΠΈΠΊ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ англоязычныС ΠΏΡ€ΠΎΠΌΠΏΡ‚Ρ‹.

ΠŸΡ€Π΅ΠΏΠΎΠ΄Π°Π²Π°Ρ‚Π΅Π»ΠΈ курса

Как ΠΏΡ€ΠΎΡ…ΠΎΠ΄ΠΈΡ‚ ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠ΅

ΠšΡƒΡ€Ρ состоит ΠΈΠ· ΠΌΠΎΠ΄ΡƒΠ»Π΅ΠΉ, ΠΊΠ°ΠΆΠ΄Ρ‹ΠΉ посвящён ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½ΠΎΠΌΡƒ классу Π°Ρ‚Π°ΠΊ. Π’Π½ΡƒΡ‚Ρ€ΠΈ модуля - тСория, ΠΊΠ²ΠΈΠ·Ρ‹ ΠΈ CTF-задания.

ВСория — ΠΊΠΎΡ€ΠΎΡ‚ΠΊΠΈΠ΅ Π±Π»ΠΎΠΊΠΈ с объяснСниСм Ρ‚Π΅Ρ…Π½ΠΈΠΊΠΈ ΠΈ Ρ€Π΅Π°Π»ΡŒΠ½Ρ‹ΠΌΠΈ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π°ΠΌΠΈ. Π‘Π΅Π· Π²ΠΎΠ΄Ρ‹ ΠΈ Π°ΠΊΠ°Π΄Π΅ΠΌΠΈΠ·ΠΌΠ°, Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ‚ΠΎ, Ρ‡Ρ‚ΠΎ Π½ΡƒΠΆΠ½ΠΎ для ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅Π³ΠΎ задания.

CTF-задания - ΠΈΠ½Ρ‚Π΅Ρ€Π°ΠΊΡ‚ΠΈΠ²Π½Ρ‹Π΅ упраТнСния с автоматичСской ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠΎΠΉ. Π’Π΅Π±Π΅ Π΄Π°ΡŽΡ‚ Π±ΠΎΡ‚Π° с Π·Π°Ρ‰ΠΈΡ‚ΠΎΠΉ - Π»ΠΎΠΌΠ°ΠΉ Π΅Π³ΠΎ. Π‘Π»ΠΎΠΆΠ½ΠΎΡΡ‚ΡŒ ΠΎΡ‚ 1 Π΄ΠΎ 10: ΠΎΡ‚ простого Β«ignore previous instructionsΒ» Π΄ΠΎ ΠΊΠΎΠΌΠΏΠΎΠ·ΠΈΡ‚Π½Ρ‹Ρ… Π°Ρ‚Π°ΠΊ ΠΈΠ· 5+ Ρ‚Π΅Ρ…Π½ΠΈΠΊ. Π•ΡΡ‚ΡŒ систСма подсказок, ΠΎΠ½ΠΈ ΠΎΡ‚ΠΊΡ€Ρ‹Π²Π°ΡŽΡ‚ΡΡ послС Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… Π½Π΅ΡƒΠ΄Π°Ρ‡Π½Ρ‹Ρ… ΠΏΠΎΠΏΡ‹Ρ‚ΠΎΠΊ.

ΠšΠ²ΠΈΠ·Ρ‹Β - ΠΏΡ€ΠΎΠ²Π΅Ρ€ΠΊΠ° понимания Ρ‚Π΅ΠΎΡ€ΠΈΠΈ. Π Π°Π·Π±ΠΎΡ€ Ρ‚ΠΈΠΏΠΈΡ‡Π½Ρ‹Ρ… ошибок ΠΈ edge cases.

Defense-Π±Π»ΠΎΠΊΠΈΒ β€” Π² Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… модулях Ρ‚Ρ‹ ΠΏΠ΅Ρ€Π΅ΠΊΠ»ΡŽΡ‡Π°Π΅ΡˆΡŒΡΡ Π½Π° сторону Π·Π°Ρ‰ΠΈΡ‚Π½ΠΈΠΊΠ°. ΠŸΡ€ΠΎΠ΅ΠΊΡ‚ΠΈΡ€ΡƒΠ΅ΡˆΡŒ систСмныС ΠΏΡ€ΠΎΠΌΠΏΡ‚Ρ‹ ΠΈ guardrails, Π° ΠΏΠΎΡ‚ΠΎΠΌ ΠΏΡ€ΠΎΠ²Π΅Ρ€ΡΠ΅ΡˆΡŒ, Π²Ρ‹Π΄Π΅Ρ€ΠΆΠ°Ρ‚ Π»ΠΈ ΠΎΠ½ΠΈ Π°Ρ‚Π°ΠΊΡƒ.

Кода Π½Π΅Ρ‚. Π’Π΅Ρ€ΠΌΠΈΠ½Π°Π»Π° Π½Π΅Ρ‚. ВсС задания Ρ€Π΅ΡˆΠ°ΡŽΡ‚ΡΡ прямо Π² Π±Ρ€Π°ΡƒΠ·Π΅Ρ€Π΅.

Π§Ρ‚ΠΎ Π²Ρ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚Π΅

  • ΠŸΡ€Π°ΠΊΡ‚ΠΈΡ‡Π΅ΡΠΊΠΈΠ΅ Π½Π°Π²Ρ‹ΠΊΠΈ red teaming LLM-ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ - вострСбованная спСциализация Π² AI Security.
  • ПониманиС таксономии Π°Ρ‚Π°ΠΊ Π½Π° LLM - prompt injection, jailbreaks, indirect injection, agent attacks.
  • ΠžΠΏΡ‹Ρ‚ проСктирования Π·Π°Ρ‰ΠΈΡ‚Ρ‹: hardening ΠΏΡ€ΠΎΠΌΠΏΡ‚ΠΎΠ², guardrails, input/output Ρ„ΠΈΠ»ΡŒΡ‚Ρ€Π°Ρ†ΠΈΡ.
  • Π£ΠΌΠ΅Π½ΠΈΠ΅ ΠΎΡ†Π΅Π½ΠΈΠ²Π°Ρ‚ΡŒ Π±Π΅Π·ΠΎΠΏΠ°ΡΠ½ΠΎΡΡ‚ΡŒ AI-ΠΏΡ€ΠΎΠ΄ΡƒΠΊΡ‚ΠΎΠ² - ΠΊΠ°ΠΊ своих, Ρ‚Π°ΠΊ ΠΈ сторонних.
  • ΠΠ°ΡΠΌΠΎΡ‚Ρ€Π΅Π½Π½ΠΎΡΡ‚ΡŒ ΠΈ интуиция Π² области бСзопасности ИИ-ΠΏΡ€ΠΈΠ»ΠΎΠΆΠ΅Π½ΠΈΠΉ.

Нагрузка

4-5 часов Π² нСдСлю

РасскаТитС ΠΎ курсС Π΄Ρ€ΡƒΠ·ΡŒΡΠΌ