141просмотров
50.5%от подписчиков
16 августа 2024 г.
📷 ФотоScore: 155
Mistral AI выпустил модель Mistral Large 2 123B. Она устанавливает новый бенчмарк в генерации кода среди open source моделей, незначительно уступая GPT-4 omni. Mistral Large 2 имеет архитектуру с 123B параметров и контекстом 128к, предназначенную для работы на одной ноде. Модель доступна на La Platforme и Huggingface с весами. Mistral Large 2 поддерживает 13 языков, включая русский, японский, арабский, корейский и более 80 языков программирования. Модель была донастроена для минимизации галлюцинаций и распознает, когда у нее недостаточно информации для уверенного ответа. Mistral Large 2 превосходит Llama 3.1 в генерации кода и математике, при этом модель в 3 раза меньше. Примечательно, что на тестах, проведенных командой Mistral, LLAMA 3.1 405b на отдельных бенчмарках показывает результаты лучше, чем в официальном пейпере разработчиков LLAMA. #Stateoftheart