
Пригоди GPU Nvidia все більше нагадують фантастичні романи, де постійно фігурують суперпроцесори, що дають небачені можливості й стають об'єктами різної активності, від контрабанди до кримінального переслідування.
Спочатку їх забороняли постачати до Китаю. Тепер Трамп заявив, що їх, а саме сучасну модель H200, можна постачати до Китаю, але з обмеженнями. Китайська влада тим часом навпаки, рекомендує місцевим компаніям не використовувати західні чіпи, наполягаючи на використанні аналогів від Huawei та навіть включивши їх до офіційного списку постачальників. Проблема, щоправда, в тому, що китайські чіпи поки що далеко не такі хороші в навчанні моделей.
Тепер TheInformation пише, що DeepSeek тренує наступну модель на Nvidia Blackwell – тобто чіпах вже наступного покоління, які постачати до Китаю навіть не планується.
Схема постачання, описана джерелами, заслуговує на окрему екранізацію. Створюються «фантомні дата-центри» в Південно-Східній Азії, закуповується легальне обладнання, проходить офіційний аудит від Nvidia або Dell. Після чого сервери розбирають до гвинтика і ввозять до Китаю як запчастини. Причому контрабандисти віддають перевагу системам з 8 чіпів, а не передовим стійкам NVL72 вагою в півтори тонни – логістика диктує архітектуру, у валізі стійку не вивезеш.
Тим часом DeepSeek робить ставку на метод sparse attention для зниження вартості інференсу. Саме архітектура Blackwell містить апаратне прискорення для таких обчислень, що дає двократний приріст продуктивності.
Ось так і виглядає реалізація кіберпанку.