22.4Kпросмотров
30 сентября 2025 г.
📷 ФотоScore: 24.6K
🚀 Обновление Giga-Embeddings: лидер ruMTEB и открытая лицензия Мы выпускаем обновление Giga-Embeddings — 3B модель для преобразования текста в семантические векторы. Идеально для RAG, поиска и кластеризации. 📈 Метрики #1 в ruMTEB (74.1) — уверенный отрыв среди open-source. 🧩 Зачем это вам
• Надёжный RAG без галлюцинаций: точнее извлекает факты из базы.
• Поиск по документам и тикетам, FAQ-боты, дубликаты/кластеризация.
• Быстрый старт в проде: свободная лицензия, коммерческое использование разрешено. ⚙️ Как попробовать за 60 секунд
# pip install sentence-transformers
from sentence_transformers import SentenceTransformer
m = SentenceTransformer( "ai-sage/Giga-Embeddings-instruct", model_kwargs={"trust_remote_code": "True"}, config_kwargs={"trust_remote_code": "True"}
) def get_detailed_instruct(task_description: str, query: str) -> str: return f'Instruct: {task_description}\nQuery:{query}' task = 'Дан вопрос, необходимо найти среди документов ответ' queries = [get_detailed_instruct(task, "Как настроить доступ к базе знаний?")]
documents = [ "Чтобы настроить доступ к базе знаний вам нужно открыть инструкцию по онбордингу саппорта, и в выпадающем списке найти...", "Чтобы убрать звуки, вибрацию и световое оповещение в iPhone, активируйте беззвучный режим или режим «не беспокоить»." ]
emb_queries = m.encode(queries)
emb_documents = m.encode(documents)
print(emb_queries @ emb_documents.T) 📚 Полезные ссылки:
• GitVerse
• HF