+22 голоса |
Китайський AI-стартап DeepSeek сколихнув світ своєю AI-моделлю з відкритим вихідним кодом.
За даними TechCrunch, компанія DeepSeek зазначила, що її спеціалізована модель «DeepSeek-R1», яка випущена 20 січня, перевершила «o1» від OpenAI в тестах на продуктивність. Вона також посіла перше місце в чарті завантажень безоплатних застосунків в Apple App Store, випередивши ChatGPT.
За даними TechCrunch і технічного звіту DeepSeek, у розробку R1 було вкладено близько 5,576 млн дол. Це одна десята частина витрат, які Meta використовувала для розробки своєї останньої AI-моделі. DeepSeek навчила модель на низькотехнологічному чипі NVIDIA H800, дозволеному для експорту до Китаю, і досягла точності 79,8% в еталонному тесті Математичної олімпіади США, перевершивши o1 від OpenAI (79,2%). У тестах на кодування R1 показав точність 65,9%, що краще, ніж в o1 (63,4%).
DeepSeek перевела R1 і «DeepSeek-V3», випущений минулого року, до категорії з відкритим вихідним кодом. У звіті також ідеться, що вартість API нижча, ніж в OpenAI, що підвищує доступність.
Досягнення DeepSeek змінюють наявний конкурентний ландшафт AI, який колись характеризувався «війною капіталів». Сатья Наделла (Satya Nadella), виконавчий директор (CEO) Microsoft, сказав в інтерв'ю CNBC: «Модель DeepSeek вражає з погляду ефективності обчислень і скорочення витрат», і додав, що «ми повинні серйозно ставитися до досягнень Китаю».
Комп’ютерний розум: генеративний штучний інтелект у рішеннях AWS
+22 голоса |