Представлений DeepSeek V4 обіцяє агентські можливості за частку вартості

24 апреля 2026 г., 17:25

Software

Китайський стартап DeepSeek представив прев'ю-версію своєї довгоочікуваної великої мовної моделі V4, що стало черговим етапом у стрімкій експансії компанії на ринку штучного інтелекту.

Як повідомляє CNBC, нова модель з відкритим вихідним кодом виходить у двох версіях - Pro та Flash. Розробники стверджують, що V4 демонструє високу продуктивність у порівнянні з конкурентами, особливо у задачах, пов'язаних із автономними агентами, обробкою знань та логічним висновком. Новинка вже оптимізована для роботи з популярними інструментами, такими як Claude Code від Anthropic.

DeepSeek V4 базується на архітектурі Mixture-of-Experts (MoE) 2.0, яка у версії Pro налічує 1,6 трлн загальних параметрів, з яких під час кожного запиту активуються лише 49 млрд. Найбільш радикальним оновленням стало розширення контекстного вікна до 1 млн токенів, що у вісім разів перевищує можливості попередньої версії. Для стабільної роботи з таким обсягом даних інженери впровадили систему Engram, яка використовує хеш-пошук у пам'яті DRAM для миттєвого доступу до знань, а також механізм Manifold-Constrained Hyper-Connections (mHC) для стабілізації навчання на трильйонній шкалі. Завдяки новій системі Dynamic Sparse Attention (DSA) з індексатором Lightning Indexer, модель демонструє точність у 97% у тестах на пошук інформації в наддовгих документах.

Слід відзначити, що реліз відбувся трохи більше ніж через рік після виходу моделі R1, яка спричинила великий галас на світових технологічних ринках завдяки своїй екстремальній економічній ефективності. За даними аналітиків Counterpoint Research, V4 продовжує цю стратегію, пропонуючи ще нижчі витрати на інференс. Хоча ринок уже звик до конкурентоспроможності китайських AI-рішень, поява V4 посилила внутрішню боротьбу в Китаї, де такі гіганти, як Alibaba та ByteDance, також активно оновлюють свої продуктові лінійки.

Одним із ключових аспектів релізу стало питання технічного забезпечення. Китайський технологічний гігант Huawei підтвердив, що його останні обчислювальні кластери на базі процесорів Ascend AI підтримують роботу DeepSeek V4. Це свідчить про успішні зусилля Пекіна з розбудови суверенної AI-інфраструктури в умовах жорстких експортних обмежень США на передові чипи компанії NVIDIA. Здатність моделі працювати на локальному обладнанні може значно знизити залежність китайського технологічного сектору від американських технологій.

Ринок відреагував на анонс неоднозначно: акції деяких китайських розробників AI, таких як MiniMax та Knowledge Atlas Technology, впали на 8–9% на торгах у Гонконзі через побоювання посилення конкуренції. Водночас папери найбільших китайських контрактних виробників чипів продемонстрували стрімке зростання. Акції SMIC злетіли на 10,01%, а Hua Hong Semiconductor зросли на 15,18%, що відображає впевненість інвесторів у розвитку вітчизняної напівпровідникової бази для підтримки нових моделей AI.

Аналітики зазначають, що випуск DeepSeek V4 демонструє зміну фокусу в індустрії AI від простого збільшення параметрів моделей до радикальної оптимізації вартості їх експлуатації. Якщо модель R1 довела, що потужний інтелект можна навчити за суму меншу ніж 6 млн дол., то V4 робить акцент на агентських можливостях — здатності AI самостійно виконувати складні послідовності дій у робочому середовищі. Це створює пряму загрозу для західних розробників, оскільки китайські компанії пропонують аналогічний функціонал за значно менші гроші, змушуючи глобальних гравців переглядати свої стратегії капітальних витрат.

Стратегія охолодження ЦОД для епохи AI