DeepSeek зазнав напливу користувачів та кібератаки

28 января 2025 г., 9:35

Як пише Reuters, китайський стартап DeepSeek заявив у понеділок, що тимчасово обмежить реєстрацію через кібератаку після того, як АІ-помічник компанії набув несподіваної популярності.

Раніше цього дня стартап також зіткнувся з перебоями в роботі свого веб-сайту після того, як його AI-асистент став найпопулярнішим безкоштовним додатком, доступним в App Store.

Компанія вирішила проблеми, пов'язані з АРІ і неможливістю користувачів увійти на сайт. Перебої в роботі в понеділок були найтривалішими за останні 90 днів і збігаються зі стрімким зростанням популярності додатку.

DeepSeek у понеділок також повідомила, що її АІ-модель Janus-Pro-7B випередила DALL-E 3 від OpenAI та Stability AI від Stable Diffusion у рейтингу лідерів з генерації зображень за допомогою текстових підказок.

Нова модель є покращеною версією Janus, яка була випущена наприкінці минулого року, і з'явилася після того, як компанія DeepSeek випустила нового асистента на базі моделі DeepSeek-V3.

У технічному звіті DeepSeek йдеться про те, що нова модель покращує Janus завдяки вдосконаленню процесів навчання, якості даних і розміру моделі, що призводить до кращої стабільності зображення і багатшої деталізації.

Janus-Pro досягнув більш візуально привабливих і стабільних результатів, додавши 72 мільйони високоякісних синтетичних зображень і збалансувавши їх з реальними даними, йдеться у звіті.

Стартап додав, що більша версія моделі, яка містить до 7 мільярдів параметрів, покращила швидкість навчання і точність перетворення тексту в зображення та розуміння завдань.

Минулого тижня DeepSeek запустила безкоштовного помічника, який, за її словами, використовує менше даних і коштує вдвічі дешевше, ніж моделі існуючих гравців, що, можливо, знаменує собою переломний момент в рівні інвестицій, необхідних для AI.

За даними компанії Sensor Tower додаток на базі моделі DeepSeek-V3, яка, за словами її творців, «очолює список лідерів серед моделей з відкритим вихідним кодом і конкурує з найсучаснішими моделями з закритим вихідним кодом у всьому світі», різко зріс у популярності серед американських користувачів з моменту його запуску 10 січня.

DeepSeek справив глибоке враження на Кремнієву долину, перевернувши широко поширені погляди про першість США в галузі AI і ефективність експортного контролю Вашингтона, спрямованого на стримання китайських розробок, в першу чергу - чипів.

У понеділок акції технологічних компаній на фоні цією ситуації суттєіо впали в ціні.

Моделі AI вимагають просунутих чипів для свого навчання. Адміністрація Байдена з 2021 року розширила сферу дії заборон, покликаних зупинити експорт цих чипів до Китаю і використання їх для навчання AI-моделей китайських фірм.

Однак дослідники DeepSeek написали в статті минулого місяця, що DeepSeek-V3 використовував для навчання не дуже прогресивні чипи Nvidia H800.

Мало що відомо про компанію, яка стоїть за DeepSeek, невеликим стартапом з Ханчжоу, заснованим у 2023 році, коли гігант пошукової системи Baidu випустив першу китайську модель штучного інтелекту, що працює з великою кількістю мов.

Відтоді десятки великих і малих китайських технологічних компаній випустили власні моделі штучного інтелекту, але DeepSeek є першою, яку американська технологічна індустрія оцінила як таку, що відповідає або навіть перевершує продуктивність найсучасніших американських моделей.

Стратегія охолодження ЦОД для епохи AI