Давид Сільвер (творець AlphaGo) та Річард Саттон (один з батьків reinforcement learning) опублікували дослідження, яке може кардинально змінити розуміння майбутнього АІ.
Головна теза: ера навчання на людських даних підходить до кінця. Більшість високоякісних текстових джерел уже вичерпано, а прогрес LLM сповільнюється.
Що далі? Системи нового покоління навчатимуться з власного досвіду, а не з людських текстів. Приклад: AlphaProof (медаліст математичної олімпіади) спочатку вивчив 100 тисяч людських доказів, а потім згенерував 100 мільйонів власних через взаємодію з формальними системами.
Ключові відмінності майбутніх АІ: → Безперервні потоки досвіду замість коротких діалогів → Дії в реальному світі через роботів/сенсори → Навчання на об'єктивних результатах, а не людських оцінках → Власні форми мислення, не обмежені людською логікою
Для бізнесу це означає:
- Персоналізовані системи, що адаптуються роками (здоров'я, освіта).
- Автономні R&D агенти для наукових досліджень.
- Експоненціальне прискорення інновацій.
Але є ризики:
- Менше можливостей для людського контролю.
- Складніша інтерпретація рішень.
- Невизначеність у регулюванні та відповідальності.
Реальність: перехід вже розпочався. Anthropic та OpenAI тестують агентів, що самостійно користуються комп'ютерами. Google навчає роботів через власні експерименти.
Висновок: компанії, які першими адаптуються до "ери досвіду", отримають величезні конкурентні переваги. Але це вимагає не лише технологічних інвестицій, а й переосмислення управління ризиками.
Час діяти — зараз. Питання не в тому, чи настане ця ера, а в тому, чи будете ви готові.

Стратегія охолодження ЦОД для епохи AI