`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

DeepSeek зазнав напливу користувачів та кібератаки

0 
 
Як пише Reuters, китайський стартап DeepSeek заявив у понеділок, що тимчасово обмежить реєстрацію через кібератаку після того, як АІ-помічник компанії набув несподіваної популярності.
 
Раніше цього дня стартап також зіткнувся з перебоями в роботі свого веб-сайту після того, як його AI-асистент став найпопулярнішим безкоштовним додатком, доступним в App Store.
 
Компанія вирішила проблеми, пов'язані з АРІ і неможливістю користувачів увійти на сайт. Перебої в роботі в понеділок були найтривалішими за останні 90 днів і збігаються зі стрімким зростанням популярності додатку.

DeepSeek у понеділок також повідомила, що її АІ-модель Janus-Pro-7B випередила DALL-E 3 від OpenAI та Stability AI від Stable Diffusion у рейтингу лідерів з генерації зображень за допомогою текстових підказок.

Нова модель є покращеною версією Janus, яка була випущена наприкінці минулого року, і з'явилася після того, як компанія DeepSeek випустила нового асистента на базі моделі DeepSeek-V3.

У технічному звіті DeepSeek йдеться про те, що нова модель покращує Janus завдяки вдосконаленню процесів навчання, якості даних і розміру моделі, що призводить до кращої стабільності зображення і багатшої деталізації.

Janus-Pro досягнув більш візуально привабливих і стабільних результатів, додавши 72 мільйони високоякісних синтетичних зображень і збалансувавши їх з реальними даними, йдеться у звіті.

Стартап додав, що більша версія моделі, яка містить до 7 мільярдів параметрів, покращила швидкість навчання і точність перетворення тексту в зображення та розуміння завдань.

Минулого тижня DeepSeek запустила безкоштовного помічника, який, за її словами, використовує менше даних і коштує вдвічі дешевше, ніж моделі існуючих гравців, що, можливо, знаменує собою переломний момент в рівні інвестицій, необхідних для AI.
 
За даними компанії Sensor Tower додаток на базі моделі DeepSeek-V3, яка, за словами її творців, «очолює список лідерів серед моделей з відкритим вихідним кодом і конкурує з найсучаснішими моделями з закритим вихідним кодом у всьому світі», різко зріс у популярності серед американських користувачів з моменту його запуску 10 січня.
 
DeepSeek справив глибоке враження на Кремнієву долину, перевернувши широко поширені погляди про першість США в галузі AI і ефективність експортного контролю Вашингтона, спрямованого на стримання китайських розробок, в першу чергу - чипів.
 
У понеділок акції технологічних компаній на фоні цією ситуації суттєіо впали в ціні.
 
Моделі AI вимагають просунутих чипів для свого навчання. Адміністрація Байдена з 2021 року розширила сферу дії заборон, покликаних зупинити експорт цих чипів до Китаю і використання їх для навчання AI-моделей китайських фірм.
 
Однак дослідники DeepSeek написали в статті минулого місяця, що DeepSeek-V3 використовував для навчання не дуже прогресивні чипи Nvidia H800.

Мало що відомо про компанію, яка стоїть за DeepSeek, невеликим стартапом з Ханчжоу, заснованим у 2023 році, коли гігант пошукової системи Baidu випустив першу китайську модель штучного інтелекту, що працює з великою кількістю мов.

Відтоді десятки великих і малих китайських технологічних компаній випустили власні моделі штучного інтелекту, але DeepSeek є першою, яку американська технологічна індустрія оцінила як таку, що відповідає або навіть перевершує продуктивність найсучасніших американських моделей. 

Стратегія охолодження ЦОД для епохи AI

0 
 

Напечатать Отправить другу

Читайте также

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT