Французська Mistral AI SAS представила Magistral, нову лінійку великих мовних моделей, оптимізованих для міркування.
Нова серія LLM включає дві моделі. Перша - Magistral Small, доступна за ліцензією з відкритим кодом і має 24 мільярди параметрів. Більш потужна модель під назвою Magistral Medium буде доступна через хмарні сервіси Mistral AI.
Дві моделі серії Magistral мають кілька спільних рис. Обидві розуміють кілька мов і мають функцію ланцюжка думок, яка дозволяє їм розбивати складні завдання на простіші підзавдання. Більше того, вони можуть відображати підзавдання, пов'язані з генерацією швидкої відповіді, що дозволяє користувачам перевіряти її точність.
Компанія порівняла дві моделі на тестових задачах з математичної олімпіади США 2024 року. Magistral Medium набрала 73,6% з типовими налаштуваннями і 90% з конфігурацією, розробленою для підвищення якості результатів. Magistral Small - 70,7% і 83,3% відповідно.
Magistral Medium також включає оптимізацію швидкості, яка недоступна в її однойменній моделі з відкритим кодом. Коли користувачі отримують доступ до першої моделі через Le Chat, чат-бот сервіс Mistral, вони можуть активувати два налаштування, які називаються Think mode і Flash Answers. За словами Mistral, ці налаштування дозволяють Magistral Medium відповідати на запити майже в 10 разів швидше, ніж конкурентні моделі.
При розробці Magistral компанія використовувала популярний метод навчання АІ, відомий як підкріплювальне навчання, або RL.
Mistral випустила код для Magistral Small на Hugging Face. Magistral Medium, у свою чергу, доступний через Le Chat і інтерфейс програмування додатків компанії для розробників.
Захищені ноутбуки Getac B360 - нове покоління мобільної продуктивності для роботи в екстремальних умовах