| 0 |
|
Компанія xAI оголосила про негайний запуск нової версії своєї АІ-моделі Grok 4.1, яка тепер доступна всім користувачам на платформі grok.com, у соціальній мережі Х, а також у мобільних додатках для iOS та Android.
Grok 4.1 може бути вибрана явно або працює автоматично (Auto mode). Розробники заявляють, що нова модель досягла значних покращень у реальній зручності використання, зокрема у творчих, емоційних та спільних взаємодіях.
У компанії зазначили, що Grok 4.1 є більш чутливою до нюансів наміру, переконливішою у спілкуванні та послідовнішою у своїй особистості, повністю зберігаючи інтелект і надійність попередніх версій.
Модель пройшла двотижневе "тихе" впровадження (Silent Rollout) з 1 по 14 листопада, під час якого проводилися безперервні "сліпі" парні оцінки. За результатами цього тестування, Grok 4.1 отримала перевагу в 64,78% випадків порівняно з попередньою робочою моделлю.
Для досягнення цього результату xAI застосувала ту саму інфраструктуру навчання з підкріпленням, що використовувалася для Grok 4, оптимізувавши стиль, особистість, корисність та узгодженість моделі.
Виробник зазначає, що Grok 4.1 демонструє лідерство у ключових публічних рейтингах. У текстовому LMArena Text Leaderboard модель Grok 4.1 Thinking посіла перше загальне місце з рейтингом 1483 Elo, випередивши найближчу модель, що не належить xAI, на 31 бал. Навіть Grok 4.1 у швидкому режимі без функції Thinking посідає друге місце (1465 Elo), перевершуючи повні конфігурації всіх інших моделей з публічного рейтингу.
Особливий акцент було зроблено на покращенні емоційного інтелекту. У тесті EQ-Bench3, який оцінює активний емоційний інтелект, розуміння, емпатію та навички спілкування, Grok 4.1 Thinking отримала 1586 Elo — значно вищий показник, ніж у попереднього Grok 4 (1206 Elo).
Крім того, модель продемонструвала високу ефективність у творчому письмі. У бенчмарку Creative Writing v3 Grok 4.1 Thinking посіла друге місце, отримавши 1721.9 Elo.
Нарешті, xAI повідомила про значне скорочення галюцинацій (фактичних помилок) в Grok 4.1, що підвищує надійність моделі під час інформаційних запитів.
Стратегія охолодження ЦОД для епохи AI
| 0 |
|

