1.4Kпросмотров
12 октября 2023 г.
Score: 1.5K
Потыкал новую модель от Microsoft LLaVA - мультимодальную модель искусственного интеллекта
Тональность: 58%🙂 Объективность: 50%✅ Лучше всего её описал разработчик модели Чуньюань Ли: "MiniGPT: ChatGPT, but for images" Основные выводы: - Количество параметров - 13 млрд
- Модель умеет работать одновременно с текстом и изображениями (мультимодальность)
- Показала хорошие результаты в описании изображений и ответах на вопросы по картинкам
- Пока не очень справляется с распознаванием текста с изображений. Делает ошибки. Модель открытая. Пробуйте. Изучайте. Исходный код github
Официальный сайт