AI наближається до того, щоб зрівнятися з людським загальним інтелектом

27 декабря 2024 г., 13:40

cloud computing

Компанія H2O.ai оголосила про те, що її агент h2oGPTe посів перше місце в рейтингу GAIA (General AI Assistants) з безпрецедентним результатом 65%, випередивши Google Langfun Agent на 49%, Microsoft Research на 38% і Hugging Face на 33%.

Зазначається, це досягнення показує, що H2O.ai домінує у напрямку AI-агентів загального призначення, що розвивається, встановлюючи новий золотий стандарт для галузі.

Еталон GAIA вимірює, наскільки корисні AI-системи у розв'язанні реальних завдань, що вимагають від людини багато часу, роздумів і зусиль. Він складається із сотень завдань, що вимагають кропіткого дослідження, аналізу даних, роботи з документами та міркувань. Люди з вищою освітою набирають 92% балів, а для вирішення всіх 300 завдань тестового набору потрібно кілька людиноднів.

Агент h2oGPTe Agent випередив конкурентів, продемонструвавши надійність, точність і ефективність, що підкреслює його готовність до використання в корпоративних системах, які значною мірою залежать від кваліфікованих помічників.

Шрі Амбаті (Sri Ambati), засновник і генеральний директор H2O.ai, прокоментував: «Сьогодні ми оголошуємо, що AI перебуває всього в 30% від того, щоб зрівнятися з людським рівнем загального інтелекту за еталоном GAIA. Відкриті питання в GAIA є кращим показником інтелекту, ніж MMLU, який заснований на множинному виборі. Ще рік тому вся екосистема Gen AI навряд чи могла подолати десяту частку точності в одному з найскладніших еталонів AGI.

Творці з H2O.ai побудували агентний AI h2oGPTe, оснащений найкращими у світі моделями для міркувань, мультимодального розуміння зображень, відео, мови, генерації та виконання коду, щоб перемогти в бенчмарку GAIA з приголомшливим 15-відсотковим стрибком точності порівняно з попереднім рекордом, встановленим дослідниками з Google Deepmind за допомогою того ж Claude-3.5-Sonnet. Агент h2oGPTe також на 27% перевершив агента Magentic-1 від Microsoft Research, який використовував модель o1 від OpenAI.

Агентський AI живиться SaaS, і тепер, коли агентський AI h2oGPTe став загальнодоступним, усі наші корпоративні клієнти можуть розв'язувати широкий спектр складних бізнес-завдань і дослідницьких завдань».

Enterprise h2oGPTe 1.6 включає функцію Agent і доступний у всіх публічних хмарах, віртуальних приватних хмарах і для локального розгортання.

Стратегія охолодження ЦОД для епохи AI