Attackers Adapt: Why “We Tested Prompt Injection” Doesn’t Mean You’re Safe

Автор: David Campbell

Загружено: 2026-03-02

Просмотров: 97

Описание: If your agent passes 500 jailbreak prompts, that’s nice.

It doesn’t mean you’re secure.

Security is adversarial. Attackers iterate. They probe your system, learn how it responds, and route around your controls.

Static prompt injection tests are useful for regression.
They are not a realistic model of an adaptive attacker.

In this episode:
Why static jailbreak benchmarks overestimate robustness
What “the attacker moves second” actually means
How adaptive attacks work against tool-using agents
What credible adversarial evaluation should include
Why replayability and regression matter

An attacker only needs one working path. Your benchmark needs 100%.

Research referenced:
Nasr et al., “The Attacker Moves Second” (2025)
https://arxiv.org/abs/2510.09023

AgentDojo (2024)
https://arxiv.org/abs/2406.13352

Static tests aren’t useless. They’re just not the top of the pyramid.

Не удается загрузить Youtube-плеер. Проверьте блокировку Youtube в вашей сети.
Повторяем попытку...

Attackers Adapt: Why “We Tested Prompt Injection” Doesn’t Mean You’re Safe

Доступные форматы для скачивания:

Скачать видео

Информация по загрузке:

Скачать аудио

Похожие видео

Porters Neck HOA Fees Explained (2026): Worth It or Overpriced?

Porters Neck HOA Fees Explained (2026): Worth It or Overpriced?

IZRAEL WKROCZYŁ DO LIBANU! Trump przeliczył się ws. Iranu. Teheran daje odwet na Zatoce Perskiej

IZRAEL WKROCZYŁ DO LIBANU! Trump przeliczył się ws. Iranu. Teheran daje odwet na Zatoce Perskiej

Defensive Refusal Bias: When AI Blocks Cyber Defenders (ICLR Workshop 2026)

Defensive Refusal Bias: When AI Blocks Cyber Defenders (ICLR Workshop 2026)

Психология Людей, Которые Легко Забывают Имена 6 черт

Психология Людей, Которые Легко Забывают Имена 6 черт

RMDs Explained in Plain English

RMDs Explained in Plain English

Prompt Injection Is a Trust Boundary Problem

Prompt Injection Is a Trust Boundary Problem

«Профессиональные убийцы». Как устроена новая сверхсекретная спецслужба Кремля. Христо Грозев

«Профессиональные убийцы». Как устроена новая сверхсекретная спецслужба Кремля. Христо Грозев

Redlands Real Estate Market Update 2026

Redlands Real Estate Market Update 2026

Новый китайский ИИ DuClaw сделал OpenClaw мгновенным и непобедимым.

Новый китайский ИИ DuClaw сделал OpenClaw мгновенным и непобедимым.

KOPIE GABINETÓW, FAŁSZOWANIE KALENDARZA - JAK KREML UKRYWA, GDZIE JEST PUTIN

KOPIE GABINETÓW, FAŁSZOWANIE KALENDARZA - JAK KREML UKRYWA, GDZIE JEST PUTIN

🤯Этот ЭФИР ШАХНАЗАРОВА запомнят НА ВЕКА! ВЫДАЛ ЛЮТУЮ ДИЧЬ про Трампа. Муж Скабеевой ПОБЕЛЕЛ. Лучшее

🤯Этот ЭФИР ШАХНАЗАРОВА запомнят НА ВЕКА! ВЫДАЛ ЛЮТУЮ ДИЧЬ про Трампа. Муж Скабеевой ПОБЕЛЕЛ. Лучшее

Vivianne Arnold: Create a SaaS from the Niche You Know

Vivianne Arnold: Create a SaaS from the Niche You Know

New BMW F 450 GS 2025 - A2 Adventure Bike with Easy Clutch & Real GS Feel!

New BMW F 450 GS 2025 - A2 Adventure Bike with Easy Clutch & Real GS Feel!

Билл Гейтс В ПАНИКЕ: Утечки Windows 12 ПОТРЯСЛИ Мир Технологий!

Билл Гейтс В ПАНИКЕ: Утечки Windows 12 ПОТРЯСЛИ Мир Технологий!

Солдат отправляют в штурм за Telegram? | Военный обзор Юрия Фёдорова

Солдат отправляют в штурм за Telegram? | Военный обзор Юрия Фёдорова

Запуск первого Starship V3. Немцы в космосе. Гиперзвук на 3Д-принтере | Новости не только SpaceX №54

Запуск первого Starship V3. Немцы в космосе. Гиперзвук на 3Д-принтере | Новости не только SpaceX №54

⚡️ФИЛИППЕНКО: Трамп этого НЕ ОЖИДАЛ! В США растет НЕДОВОЛЬСТВО! Все из-за РЕШЕНИЯ президента

⚡️ФИЛИППЕНКО: Трамп этого НЕ ОЖИДАЛ! В США растет НЕДОВОЛЬСТВО! Все из-за РЕШЕНИЯ президента

Илон Маск про орбитальные дата‑центры и будущее ИИ

Илон Маск про орбитальные дата‑центры и будущее ИИ

Почему река Лена - самая ЖУТКАЯ Река в Мире

Почему река Лена - самая ЖУТКАЯ Река в Мире