Китайський стартап DeepSeek зробить код своїх моделей загальнодоступним, повідомило агентство Reuters у п'ятницю, посиливши свою прихильність до штучного інтелекту з відкритим вихідним кодом.
У повідомленні на платформі X компанія заявила, що наступного тижня відкриє вихідний код 5 репозіторіїв, описавши цей крок як «невеликий, але щирий прогрес», яким вона буде ділитися «з повною прозорістю».
«Ці скромні будівельні блоки нашого онлайн-сервісу були задокументовані, розгорнуті та протестовані у виробництві», - йдеться у дописі.
Минулого місяця DeepSeek сколихнула світову індустрію AI, випустивши свою модель міркувань R1 з відкритим вихідним кодом, яка конкурує з західними системами за продуктивністю, але при цьому розроблена за меншу вартість.
Прихильність компанії до відкритого коду відрізняє її від більшості китайських фірм, які, як і їхні американські конкуренти, схиляються до закритого підходу у розробці. Не дуже публічний засновник DeepSeek Лян Веньфенг (Liang Wenfeng) у рідкісному інтерв'ю китайському ЗМІ в липні минулого року заявив, що фірма не ставить комерціалізацію своїх моделей АІ на перше місце і що відкритий код має певну «м'яку силу». «Коли інші слідкують за вашими інноваціями, це дає велике відчуття досягнення, - зазначив він у інтервʼю. - Насправді, відкритий код - це скоріше культурна поведінка, ніж комерційна, і внесок у нього заслуговує на повагу».
Анонсований відкритий код забезпечує інфраструктуру для підтримки моделей AI, якими DeepSeek вже поділилася з громадськістю, спираючись на існуючі фреймворки моделей з відкритим вихідним кодом.
Це оголошення було зроблено після того, як у вівторок DeepSeek випустила новий алгоритм під назвою Native Sparse Attention (NSA), розроблений для підвищення ефективності довготривалого контекстного навчання та висновків.
Користувацька база DeepSeek стрімко зросла з минулого місяця. У Китаї це найпопулярніший сервіс чат-ботів з 22,2 мільйонами щоденних активних користувачів станом на 11 січня, що перевищує 16,95 мільйона користувачів Douban, згідно з даними Aicpb.com, китайського веб-сайту, який відстежує сервіси штучного інтелекту.
Стратегія охолодження ЦОД для епохи AI