Як пише Reuters, китайський стартап DeepSeek заявив у понеділок, що тимчасово обмежить реєстрацію через кібератаку після того, як АІ-помічник компанії набув несподіваної популярності.
Раніше цього дня стартап також зіткнувся з перебоями в роботі свого веб-сайту після того, як його AI-асистент став найпопулярнішим безкоштовним додатком, доступним в App Store.
Компанія вирішила проблеми, пов'язані з АРІ і неможливістю користувачів увійти на сайт. Перебої в роботі в понеділок були найтривалішими за останні 90 днів і збігаються зі стрімким зростанням популярності додатку.
DeepSeek у понеділок також повідомила, що її АІ-модель Janus-Pro-7B випередила DALL-E 3 від OpenAI та Stability AI від Stable Diffusion у рейтингу лідерів з генерації зображень за допомогою текстових підказок.
Нова модель є покращеною версією Janus, яка була випущена наприкінці минулого року, і з'явилася після того, як компанія DeepSeek випустила нового асистента на базі моделі DeepSeek-V3.
У технічному звіті DeepSeek йдеться про те, що нова модель покращує Janus завдяки вдосконаленню процесів навчання, якості даних і розміру моделі, що призводить до кращої стабільності зображення і багатшої деталізації.
Janus-Pro досягнув більш візуально привабливих і стабільних результатів, додавши 72 мільйони високоякісних синтетичних зображень і збалансувавши їх з реальними даними, йдеться у звіті.
Стартап додав, що більша версія моделі, яка містить до 7 мільярдів параметрів, покращила швидкість навчання і точність перетворення тексту в зображення та розуміння завдань.
Минулого тижня DeepSeek запустила безкоштовного помічника, який, за її словами, використовує менше даних і коштує вдвічі дешевше, ніж моделі існуючих гравців, що, можливо, знаменує собою переломний момент в рівні інвестицій, необхідних для AI.
За даними компанії Sensor Tower додаток на базі моделі DeepSeek-V3, яка, за словами її творців, «очолює список лідерів серед моделей з відкритим вихідним кодом і конкурує з найсучаснішими моделями з закритим вихідним кодом у всьому світі», різко зріс у популярності серед американських користувачів з моменту його запуску 10 січня.
DeepSeek справив глибоке враження на Кремнієву долину, перевернувши широко поширені погляди про першість США в галузі AI і ефективність експортного контролю Вашингтона, спрямованого на стримання китайських розробок, в першу чергу - чипів.
У понеділок акції технологічних компаній на фоні цією ситуації суттєіо впали в ціні.
Моделі AI вимагають просунутих чипів для свого навчання. Адміністрація Байдена з 2021 року розширила сферу дії заборон, покликаних зупинити експорт цих чипів до Китаю і використання їх для навчання AI-моделей китайських фірм.
Однак дослідники DeepSeek написали в статті минулого місяця, що DeepSeek-V3 використовував для навчання не дуже прогресивні чипи Nvidia H800.
Мало що відомо про компанію, яка стоїть за DeepSeek, невеликим стартапом з Ханчжоу, заснованим у 2023 році, коли гігант пошукової системи Baidu випустив першу китайську модель штучного інтелекту, що працює з великою кількістю мов.
Відтоді десятки великих і малих китайських технологічних компаній випустили власні моделі штучного інтелекту, але DeepSeek є першою, яку американська технологічна індустрія оцінила як таку, що відповідає або навіть перевершує продуктивність найсучасніших американських моделей.
Стратегія охолодження ЦОД для епохи AI