Потыкал новую модель от Microsoft LLaVA - мультимодальную мо — @chat_gpt_rub

1.4Kпросмотров

12 октября 2023 г.

Score: 1.5K

Потыкал новую модель от Microsoft LLaVA - мультимодальную модель искусственного интеллекта Тональность: 58%🙂 Объективность: 50%✅ Лучше всего её описал разработчик модели Чуньюань Ли: "MiniGPT: ChatGPT, but for images" Основные выводы: - Количество параметров - 13 млрд - Модель умеет работать одновременно с текстом и изображениями (мультимодальность) - Показала хорошие результаты в описании изображений и ответах на вопросы по картинкам - Пока не очень справляется с распознаванием текста с изображений. Делает ошибки. Модель открытая. Пробуйте. Изучайте. Исходный код github Официальный сайт

Другие посты @chat_gpt_rub