234просмотров
14 марта 2026 г.
📷 ФотоScore: 257
Google представила Gemini Embedding 2 — первую нативно мультимодальную модель эмбеддингов! ​ Теперь текст, изображения, видео, аудио и PDF переводятся в единое векторное пространство для семантического поиска и RAG. Поддерживает >100 языков, interleaved input (текст+изображение) и до 8192 токенов текста. ​ Ключевые фичи: Текст: до 8192 токенов Изображения: до 6 PNG/JPEG Видео: до 120 сек MP4/MOV Аудио: нативно, без транскрипции PDF: до 6 страниц ​ Размер вектора: 3072 по умолчанию (можно 1536/768 с Matryoshka). Уже в Public Preview на Gemini API / Vertex AI! Подробнее здесь
234
просмотров
580
символов
Нет
эмодзи
Да
медиа

Другие посты @bmlabs_ru

Все посты канала →
Google представила Gemini Embedding 2 — первую нативно мульт — @bmlabs_ru | PostSniper