234просмотров
14 марта 2026 г.
📷 ФотоScore: 257
Google представила Gemini Embedding 2 — первую нативно мультимодальную модель эмбеддингов!
Теперь текст, изображения, видео, аудио и PDF переводятся в единое векторное пространство для семантического поиска и RAG. Поддерживает >100 языков, interleaved input (текст+изображение) и до 8192 токенов текста.
Ключевые фичи:
Текст: до 8192 токенов
Изображения: до 6 PNG/JPEG
Видео: до 120 сек MP4/MOV
Аудио: нативно, без транскрипции
PDF: до 6 страниц
Размер вектора: 3072 по умолчанию (можно 1536/768 с Matryoshka). Уже в Public Preview на Gemini API / Vertex AI!
Подробнее здесь