NVIDIA представляє сімейство відкритих моделей Nemotron 3

16 декабрь, 2025 - 13:35

Компанія NVIDIA оголосила про сімейство відкритих моделей NVIDIA Nemotron 3, даних та бібліотек, розроблених для забезпечення прозорої, ефективної та спеціалізованої розробки агентного AI у різних галузях. Моделі Nemotron 3 — з розмірами Nano, Super та Ultra — представляють проривну гібридну приховану архітектуру суміші експертів (MoE - Mixture-of-Experts), яка допомагає розробникам створювати та розгортати надійні багатоагентні системи в масштабі.

Оскільки організації переходять від чат-ботів з однією моделлю до спільних багатоагентних систем AI, розробники стикаються зі зростаючими проблемами, включаючи накладні витрати на комунікацію, дрейф контексту та високі витрати на виведення. Крім того, розробникам потрібна прозорість, щоб довіряти моделям, які автоматизуватимуть їхні складні робочі процеси. Nemotron 3 безпосередньо вирішує ці проблеми, забезпечуючи продуктивність та відкритість, необхідні клієнтам для створення спеціалізованого, агентного AI.

«Відкриті інновації є основою прогресу AI», — сказав Дженсен Хуанг (Jensen Huang), засновник і генеральний директор NVIDIA. «Завдяки Nemotron ми перетворюємо передовий AI на відкриту платформу, яка надає розробникам прозорість та ефективність, необхідні для створення агентних систем у масштабі».

NVIDIA Nemotron підтримує ширші зусилля NVIDIA щодо суверенного AI, оскільки організації від Європи до Південної Кореї впроваджують відкриті, прозорі та ефективні моделі, які дозволяють їм створювати системи AI, узгоджені з їхніми власними даними, нормативними актами та цінностями.

Перші користувачі, включаючи Accenture, Cadence, CrowdStrike, Cursor, Deloitte, EY, Oracle Cloud Infrastructure, Palantir, Perplexity, ServiceNow, Siemens, Synopsys та Zoom, інтегрують моделі сімейства Nemotron для підтримки робочих процесів AI у виробництві, кібербезпеці, розробці програмного забезпечення, медіа, комунікаціях та інших галузях.

«NVIDIA та ServiceNow роками формували майбутнє AI, і найкраще ще попереду», — сказав Білл Макдермотт (Bill McDermott), голова та генеральний директор ServiceNow. «Сьогодні ми робимо важливий крок вперед, надаючи лідерам у всіх галузях можливість прискорити свою стратегію агентного AI. Інтелектуальна автоматизація робочих процесів ServiceNow у поєднанні з NVIDIA Nemotron 3 продовжить визначати стандарт з неперевершеною ефективністю, швидкістю та точністю».

У міру розширення багатоагентних систем AI розробники все більше покладаються на пропрієтарні моделі для сучасного міркування, водночас використовуючи більш ефективні та настроювані відкриті моделі для зниження витрат. Маршрутизація завдань між моделями передового рівня та Nemotron в одному робочому процесі надає агентам максимальну інтелектуальність, оптимізуючи при цьому токеноміку.

«Perplexity побудована на ідеї, що людська допитливість буде посилена точним AI, вбудованим у виняткові інструменти, як-от помічники AI», — зазначив Аравінд Срінівас (Aravind Srinivas), генеральний директор Perplexity. «За допомогою нашого маршрутизатора агентів ми можемо направляти робочі навантаження до найкращих налаштованих відкритих моделей, як-от Nemotron 3 Ultra, або використовувати провідні пропрієтарні моделі, коли завдання виграють від їхніх унікальних можливостей — гарантуючи, що наші AI-помічники працюють з винятковою швидкістю, ефективністю та масштабом».

Відкриті моделі Nemotron 3 дозволяють стартапам швидше створювати та повторювати ітерації агентів AI, а також прискорювати інновації від прототипу до корпоративного розгортання. Портфельні компанії General Catalyst та Mayfield вивчають Nemotron 3 для створення AI-команд, які підтримують співпрацю між людиною та AI.

«Стек відкритих моделей NVIDIA та програма NVIDIA Inception надають компаніям на ранніх стадіях моделі, інструменти та економічно ефективну інфраструктуру для експериментів, диференціації та швидкого масштабування», — підкреслив Навін Чадда (Navin Chaddha), керуючий партнер Mayfield. «Nemotron 3 дає засновникам фору на старті створення додатків агентного AI та AI-команд, а також допомагає їм підключитися до масивної встановленої бази NVIDIA».

Сімейство моделей MoE Nemotron 3 включає три розміри:

Nemotron 3 Nano, невелика модель із 30 мільярдами параметрів, яка активує до 3 млрд параметрів одночасно для цільових, високоефективних завдань.

Nemotron 3 Super, модель міркування високої точності з приблизно 100 мільярдами параметрів і до 10 млрд активних на токен, для багатоагентних додатків.

Nemotron 3 Ultra, великий механізм міркування з близько 500 мільярдами параметрів і до 50 млрд активних на токен, для складних додатків AI.

Вже доступний Nemotron 3 Nano є найбільш економічно ефективною моделлю за обчислювальними витратами, оптимізованою для таких завдань, як налагодження програмного забезпечення, підсумовування контенту, робочі процеси помічника AI та пошук інформації з низькими витратами на виведення. Модель використовує унікальну гібридну архітектуру MoE для підвищення ефективності та масштабованості.

Ця конструкція досягає до 4 разів вищої пропускної здатності токенів порівняно з Nemotron 2 Nano та скорочує генерацію токенів міркування до 60%, значно знижуючи витрати на виведення. З контекстним вікном у 1 млн токенів, Nemotron 3 Nano запам'ятовує більше, що робить його більш точним та краще здатним з'єднувати інформацію протягом тривалих, багатоетапних завдань.

Artificial Analysis, незалежна організація, що проводить бенчмаркінг AI, визнала модель найбільш відкритою та ефективною серед моделей того ж розміру, з провідною точністю.

Nemotron 3 Super підходить для додатків, які вимагають співпраці багатьох агентів для виконання складних завдань з низькою затримкою. Nemotron 3 Ultra служить вдосконаленим механізмом міркування для робочих процесів AI, які вимагають глибоких досліджень та стратегічного планування.

Nemotron 3 Super та Ultra використовують ультраефективний 4-бітовий формат навчання NVFP4 від NVIDIA на архітектурі NVIDIA Blackwell, значно скорочуючи вимоги до пам'яті та прискорюючи навчання. Ця ефективність дозволяє навчати більші моделі на наявній інфраструктурі без шкоди для точності порівняно з форматами вищої точності.

Завдяки сімейству моделей Nemotron 3 розробники можуть вибрати відкриту модель, яка підходить за розміром для їхніх конкретних робочих навантажень, масштабуючись від десятків до сотень агентів, отримуючи переваги від швидшого та точнішого міркування на довгострокову перспективу для складних робочих процесів.

NVIDIA також випустила колекцію навчальних наборів даних та сучасних бібліотек навчання з підкріпленням, доступних для всіх, хто створює спеціалізованих агентів AI.

Три трильйони токенів нових наборів даних для попереднього навчання Nemotron, післянавчання та навчання з підкріпленням забезпечують багаті приклади міркування, кодування та багатоетапного робочого процесу, необхідні для створення висококваліфікованих, предметно-спеціалізованих агентів. Nemotron Agentic Safety Dataset надає реальні телеметричні дані, щоб допомогти командам оцінити та посилити безпеку складних агентних систем.

Щоб прискорити розробку, NVIDIA випустила бібліотеки з відкритим кодом NeMo Gym та NeMo RL, які надають середовища для навчання та основи для післянавчання для моделей Nemotron, а також NeMo Evaluator для перевірки безпеки та продуктивності моделі. Усі інструменти та набори даних тепер доступні на GitHub та Hugging Face.

Nemotron 3 підтримується LM Studio, llama.cpp, SGLang та vLLM. Крім того, Prime Intellect та Unsloth інтегрують готові до використання середовища навчання NeMo Gym безпосередньо у свої робочі процеси, надаючи командам швидший та легший доступ до потужного навчання з підкріпленням.

Nemotron 3 Nano вже доступний на Hugging Face та через постачальників послуг виведення, включаючи Baseten, DeepInfra, Fireworks, FriendliAI, OpenRouter та Together AI.

Nemotron пропонується на корпоративних платформах AI та інфраструктури даних, включаючи Couchbase, DataRobot, H2O.ai, JFrog, Lambda та UiPath. Для клієнтів у публічних хмарах Nemotron 3 Nano буде доступний на AWS через Amazon Bedrock (бессерверний), а також незабаром підтримуватиметься на Google Cloud, CoreWeave, Crusoe, Microsoft Foundry, Nebius, Nscale та Yotta.

Nemotron 3 Nano доступний як мікросервіс NVIDIA NIM для безпечного, масштабованого розгортання будь-де на інфраструктурі, прискореній NVIDIA, для максимальної конфіденційності та контролю.

Очікується, що Nemotron 3 Super та Ultra стануть доступними в першій половині 2026 року.