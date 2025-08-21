21 августа 2025 г., 13:35

Китайський стартап DeepSeek представив оновлену версію DeepSeek-V3.1. Ця модель, за словами розробників, має «гібридну архітектуру», що робить її не лише потужною, а й надзвичайно ефективною.





Як зазначається, нова модель вміє автоматично перемикатися між «режимом обмірковування» та «режимом прямої відповіді». Це означає, що вона сама вирішує, чи потрібен їй глибокий аналіз для виконання завдання, чи достатньо швидкої генерації. Завдяки такому підходу, DeepSeek-V3.1 працює швидше за свою попередницю DeepSeek-R1 та оптимізує обчислювальні ресурси.





Також розробники суттєво розширили «пам'ять» моделі — її вікно контексту тепер становить 128 тисяч токенів. Це дозволяє моделі обробляти величезні обсяги тексту, коду та тривалі діалоги без втрати точності.





Розробники підкреслюють, що однією з головних переваг є її здатність до програмування. DeepSeek-V3.1 досягла результату 71,6% у тесті Aider, що виводить її на перше місце серед усіх відкритих моделей.





Також заявляється, що важливе для нової версії DeepSeek — це вартість її використання. Виконання завдань, що вимагають написання коду, обходиться в 68 разів дешевше, ніж у пропрієтарних систем, наприклад, Claude Opus.





DeepSeek-V3.1 вже доступна для розробників, а з 6 вересня компанія оновить тарифи на використання свого API.





Аналітики вважають, що цей реліз є потужним сигналом для всієї AI-спільноти та свідчить про те, що китайські розробники здатні створювати відкриті моделі, які можуть на рівних конкурувати з гігантами індустрії.

