`

СПЕЦІАЛЬНІ
ПАРТНЕРИ
ПРОЕКТУ

Чи використовує ваша компанія ChatGPT в роботі?

BEST CIO

Определение наиболее профессиональных ИТ-управленцев, лидеров и экспертов в своих отраслях

Человек года

Кто внес наибольший вклад в развитие украинского ИТ-рынка.

Продукт года

Награды «Продукт года» еженедельника «Компьютерное обозрение» за наиболее выдающиеся ИТ-товары

 

xAI представляє Grok 4.1: значне посилення "емоційного інтелекту" та креативності АІ-моделі

0 
 

Компанія xAI оголосила про негайний запуск нової версії своєї АІ-моделі Grok 4.1, яка тепер доступна всім користувачам на платформі grok.com, у соціальній мережі Х, а також у мобільних додатках для iOS та Android.

Grok 4.1 може бути вибрана явно або працює автоматично (Auto mode). Розробники заявляють, що нова модель досягла значних покращень у реальній зручності використання, зокрема у творчих, емоційних та спільних взаємодіях.

У компанії зазначили, що Grok 4.1 є більш чутливою до нюансів наміру, переконливішою у спілкуванні та послідовнішою у своїй особистості, повністю зберігаючи інтелект і надійність попередніх версій.

Модель пройшла двотижневе "тихе" впровадження (Silent Rollout) з 1 по 14 листопада, під час якого проводилися безперервні "сліпі" парні оцінки. За результатами цього тестування, Grok 4.1 отримала перевагу в 64,78% випадків порівняно з попередньою робочою моделлю.

Для досягнення цього результату xAI застосувала ту саму інфраструктуру навчання з підкріпленням, що використовувалася для Grok 4, оптимізувавши стиль, особистість, корисність та узгодженість моделі.

Виробник зазначає, що Grok 4.1 демонструє лідерство у ключових публічних рейтингах. У текстовому LMArena Text Leaderboard модель Grok 4.1 Thinking посіла перше загальне місце з рейтингом 1483 Elo, випередивши найближчу модель, що не належить xAI, на 31 бал. Навіть Grok 4.1 у швидкому режимі без функції Thinking посідає друге місце (1465 Elo), перевершуючи повні конфігурації всіх інших моделей з публічного рейтингу.

Особливий акцент було зроблено на покращенні емоційного інтелекту. У тесті EQ-Bench3, який оцінює активний емоційний інтелект, розуміння, емпатію та навички спілкування, Grok 4.1 Thinking отримала 1586 Elo — значно вищий показник, ніж у попереднього Grok 4 (1206 Elo).

Крім того, модель продемонструвала високу ефективність у творчому письмі. У бенчмарку Creative Writing v3 Grok 4.1 Thinking посіла друге місце, отримавши 1721.9 Elo.

Нарешті, xAI повідомила про значне скорочення галюцинацій (фактичних помилок) в Grok 4.1, що підвищує надійність моделі під час інформаційних запитів.

Стратегія охолодження ЦОД для епохи AI

0 
 

Напечатать Отправить другу

Читайте также

 

Ukraine

 

  •  Home  •  Ринок  •  IТ-директор  •  CloudComputing  •  Hard  •  Soft  •  Мережі  •  Безпека  •  Наука  •  IoT