Gartner прогнозує, що до 2028 року витрати на AI-кодинг перевищать середню зарплату розробника

До 2028 року корпоративні витрати на використання штучного інтелекту для написання коду перевищать середню заробітну плату штатного розробника. Як повідомляє Gartner, головними причинами цієї тенденції є стрімке зростання споживання токенів великими мовними моделями LLM та масовий перехід постачальників програмного забезпечення на модель оплати за фактичне використання consumption-based pricing замість фіксованої вартості за робоче місце. Оскільки токени є базовими одиницями даних, які обробляються алгоритмами, будь-яка інтенсивна розробка безпосередньо збільшує рахунки компаній. На тлі цих прогнозів на світовому ринку спостерігається підвищений інтерес до інструментів оптимізації витрат на хмарні обчислення FinOps, оскільки фінансові директори IT-корпорацій прагнуть уникнути неконтрольованого виснаження бюджетів через цифрову автоматизацію.

Старший головний аналітик Gartner Нітіш Тьягі (Nitish Tyagi) зазначив, що організації дуже швидко переходять від стадії експериментів до масштабного розгортання кодуючих AI-агентів, але катастрофічно недооцінюють фінансові наслідки. Ситуація ускладнюється тим, що самі програмісти схильні оптимізувати процеси з погляду швидкості та власної зручності, а не витрат компанії. Перехід вендорів на тарифікацію за обсяг використаних токенів робить витрати вкрай мінливими та непередбачуваними. Багато розробників AI-інструментів досі не надають прозорих механізмів калькуляції та деталізації рахунків, що позбавляє керівників інженерних департаментів можливості точно прогнозувати капітальні витрати та оцінювати реальне співвідношення витрат до отриманої бізнес-цінності. Бюджети багатьох компаній вичерпуються значно раніше запланованих термінів, оскільки звичайні користувачі в міру звикання до асистентів миттєво стають активними споживачами гігантських обсягів контексту.

Для подолання фінансових ризиків аналітики Gartner рекомендують впроваджувати жорсткі операційні моделі управління. По-перше, необхідно чітко класифікувати завдання на три моделі виконання: суто розробником, розробником разом з агентом, або повністю автономним АІ-агентом. По-друге, інженерним командам слід налаштувати інтелектуальну маршрутизацію запитів, спрямовуючи прості щоденні завдання на менші та дешевші моделі, а флагманські нейромережі залучати лише для архітектурних рішень високої вартості. По-третє, критично важливо навчити персонал практикам контекстної інженерії (context engineering) - очищати запити від надлишкових даних та стискати код перед відправкою в інференс. Окрім того, компаніям радять інтегрувати ліміти токенів безпосередньо у цикли розробки, автоматично моніторити аномалії під час ретроспектив спринтів та встановлювати жорсткі пороги автоматичного блокування запитів при перевищенні фінансових лімітів.

Прогноз компанії Gartner оголює фундаментальне економічне протиріччя сучасної індустрії штучного інтелекту: автоматизація інтелектуальної праці перестає бути дешевою. Протягом останніх кількох років бізнес-спільнота жила в парадигмі, де впровадження кодуючих AI-агентів розглядалося як простий спосіб скоротити витрати на персонал та підвищити продуктивність без значного збільшення фіксованих костів. Проте реальність споживання великих мовних моделей продемонструвала, що вартість інференсу при роботі з величезними контекстними вікнами росте експоненціально. Якщо раніше робоче місце розробника коштувало компанії умовні 30 доларів на місяць за підписку, то теперішній перехід на оплату за гігабайти надісланих токенів перетворює програмну інженерію на одну з найбільш ресурсомістких капітальних статей витрат.

Цей фінансовий тиск неминуче призведе до радикальної зміни підходів до розробки програмного забезпечення. Епоха «розумного безмежжя», коли розробники могли безконтрольно згодовувати моделі цілі репозиторії задля написання простого скрипту, добігає кінця. В IT-індустрії виникає гостра потреба у новій дисципліні — токенному менеджменті та превентивній FinOps-оптимізації для нейромереж. Компанії, які не зуміють перебудувати свої внутрішні процеси та не впровадять автоматичну маршрутизацію між комерційними великими та локальними оптимізованими open-source моделями, швидко опиняться у ситуації, коли операційна маржинальність їхніх власних продуктів впаде до критичних значень просто через оплату рахунків за хмарний інференс.

З іншого боку, така криза перевитрат створює колосальне вікно можливостей для розробників інструментів моніторингу та АІ-архітекторів нового типу. На ринку виникне шалений попит на технології локального стиснення контексту, інтелектуального кешування токенів на стороні клієнта та створення специфічних компактних моделей, які навчаються під конкретний стек технологій компанії і працюють на власних серверах, мінімізуючи залежність від дорогих провайдерів комерційних API. Таким чином, перегрів бюджетів на токени виступить потужним каталізатором децентралізації ринку AI, змушуючи бізнес відмовлятися від універсальних гігантських систем на користь гнучких, економних та суворо контрольованих локальних інженерних рішень.

Стратегія охолодження ЦОД для епохи AI