G
GigaDev — разработка GigaChat
@gigadev_channel6.5K подп.
22.4Kпросмотров
30 сентября 2025 г.
📷 ФотоScore: 24.6K
🚀 Обновление Giga-Embeddings: лидер ruMTEB и открытая лицензия Мы выпускаем обновление Giga-Embeddings — 3B модель для преобразования текста в семантические векторы. Идеально для RAG, поиска и кластеризации. 📈 Метрики #1 в ruMTEB (74.1) — уверенный отрыв среди open-source. 🧩 Зачем это вам • Надёжный RAG без галлюцинаций: точнее извлекает факты из базы. • Поиск по документам и тикетам, FAQ-боты, дубликаты/кластеризация. • Быстрый старт в проде: свободная лицензия, коммерческое использование разрешено. ⚙️ Как попробовать за 60 секунд # pip install sentence-transformers from sentence_transformers import SentenceTransformer m = SentenceTransformer( "ai-sage/Giga-Embeddings-instruct", model_kwargs={"trust_remote_code": "True"}, config_kwargs={"trust_remote_code": "True"} ) def get_detailed_instruct(task_description: str, query: str) -> str: return f'Instruct: {task_description}\nQuery:{query}' task = 'Дан вопрос, необходимо найти среди документов ответ' queries = [get_detailed_instruct(task, "Как настроить доступ к базе знаний?")] documents = [ "Чтобы настроить доступ к базе знаний вам нужно открыть инструкцию по онбордингу саппорта, и в выпадающем списке найти...", "Чтобы убрать звуки, вибрацию и световое оповещение в iPhone, активируйте беззвучный режим или режим «не беспокоить»." ] emb_queries = m.encode(queries) emb_documents = m.encode(documents) print(emb_queries @ emb_documents.T) 📚 Полезные ссылки: • GitVerse • HF
22.4K
просмотров
1505
символов
Да
эмодзи
Да
медиа

Другие посты @gigadev_channel

Все посты канала →
🚀 Обновление Giga-Embeddings: лидер ruMTEB и открытая лицен — @gigadev_channel | PostSniper