
Можливо, ви помітили останнім часом деякий сплеск повідомлень про те, що нові версії передових LLM-моделей не такі хороші, як очікувалося. Таке за останній тиждень повідомляли й про Google Gemini 2.0, й про OpenAI Orion, який начебто і перейменують для того, щоб не створювати зайвих очікувань у користувачів.
Ілля Суцкевер теж вважає, що потенціал розвитку моделей вичерпано за останні роки та ми повертаємося в епоху досліджень і відкриттів. Він стверджує, що можливості покращувати моделі шляхом масштабування на етапі навчання вийшли на плато і треба шукати наступні next thing.
Власне, те, що ми бачили із запуском o1 (строго кажучи, поки що є лише preview), це одна з таких спроб – шляхом відтворення людського мислення.
Інше питання, що людське мислення теж не дуже вивчене.