🚀 Обновление Giga-Embeddings: лидер ruMTEB и открытая лицензия Мы выпускаем обновление Giga-Embeddings — 3B модель для преобразования текста в семантические векторы. Идеально для RAG, поиска и кластеризации. 📈 Метрики #1 в ruMTEB (74.1) — уверенный отрыв среди open-source. 🧩 Зачем это вам • Надёжный RAG без галлюцинаций: точнее извлекает факты из базы. • Поиск по документам и тикетам, FAQ-боты, дубликаты/кластеризация. • Быстрый старт в проде: свободная лицензия, коммерческое использование ра...
GigaDev — разработка GigaChat
Истории и статьи про разработку GigaChat от команды разработчиков. Мы рассказываем про все, что связано с языком, речью и искусственным интеллектом
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
19 из 19🤖 Хотите больше информации про наши последние релизы? 10 декабря на «Салют, Гига!» мы подробно расскажем, что сделали за этот год в командах GigaChat, Kandinsky и GigaData (платформы для управления данными, аналитики и поиска в контексте ИИ-моделей и сервисов). От архитектур и метрик до подходов, решений и планов на будущее. Будут доклады от инженеров, разборы под капотом, постерная сессия с командами и возможность задать любые технические вопросы тем, кто эти модели создаёт. Мы делаем формат м...
📆Команда GigaChat Audio едет в Нижний Новгород с митапом про речевые технологии В программе — живые истории о том, как исследования становятся работающими сервисами: 🔘prod-ready распознавание речи на ограниченном наборе данных 🔘speaker diarization: распознавание по голосам в реальном времени 🔘быстрые команды с произвольной структурой для low-resource сценария колонок 🔘суммаризация трёхчасовых видео в GigaChat В финале вечера — нетворкинг с ребятами из нашей команды. 📆 3 октября, 18:00 📍 Н...
GigaAM-v3: новый уровень качества, пунктуация, нормализация ➡️ GitHub | HuggingFace | GitVerse В прошлом году мы открыли семейство моделей GigaAM, после чего значительно улучшили качество благодаря подходу HuBERT-CTC во второй версии. Основными запросами сообщества оставались поддержка пунктуации в наших моделях, а также улучшение на сложных срезах данных. Сегодня мы рады представить следующий большой релиз — GigaAM-v3. Что публикуем 🔘GigaAM-v3 — foundation audio encoder (база для дообучения). ...
📆Делимся секретами про наш новый синтез речи У нас случился релиз GigaTTS. Это наша новая модель синтеза, под капотом у нее GigaChat 3b, свой токенизатор речи, адаптер к LLM и всего 30к часов данных. Метрики космические: новая модель нравится людям в 2-4 раза чаще старой, а по естественности она почти всегда живее. Написали подробный технический обзор на Хабр. Фичи нового синтеза 🔘Естественная freespeech подача, неотличимая от живого человека 🔘Специальные голоса телефонных операторов – таких ...
GigaAM-v3 на Хабре ➡️ Хабр Спешим поделиться постом о создании GigaAM-v3! В статье много технических деталей для специалистов: 🔘 Распределение данных по доменам 🔘 Эксперименты с масштабирование модели по параметрам 🔘 Сравнение токенизаторов 🔘 Анализ ошибок end-to-end моделей 🔘 LLM-as-a-judge для распознавания речи По пути к релизу GigaAM-v3 ворвалась в top trending ASR-моделей на HuggingFace, обогнав свежий релиз OmniLingual ASR 🚀 👉 Приходите на «Салют, Гига!» — там вы сможете вживую пооб...
🏆 GigaChat 3 Ultra Preview & Lightning: открытые MoE-модели нового поколения В этом году мы уже радовали вас новой линейкой GigaChat 2, добавлением Reasoning в наш Web (giga.chat), опенсорсом GigaChat Lite и Giga-Embeddings и первым местом на бенчмарке ruMTEB. Что нового в этот раз? Впервые в России обучены MoE-модели такого масштаба полностью с нуля — без зависимости от зарубежных весов. Обучение огромных MoE-модели требует не только колоссальных вычислительных ресурсов, но и решения множества...
Салют, Гига! Мы выкатили программу на 10 декабря — она уже лежит на сайте. У нас два зала. В большом — основные релизы, архитектуры, истории изнутри и постерная сессия с командами. В малом — почти непрерывный техно-контент на весь день. Получилось очень плотно и качественно. Участие бесплатное, но по регистрации. Можно прийти офлайн в Москве или подключиться онлайн. Увидимся в ГигаГороде!
⚡️ GigaChat 3 Lightning в GGUF: максимум скорости для локального запуска Мы подготовили три официальные сборки модели. Теперь вы можете выбрать оптимальный баланс между скоростью и качеством под ваше железо: 🔘bf16 - Максимальное качество и стабильность. 🔘q8_0 - Золотая середина: отличное качество при меньшем потреблении памяти. 🔘q6_k - Оптимально для ноутбуков и домашних ПК: высокая скорость и экономия памяти без заметного снижения качества генерации. 💻 Function Calling Мы расширяем поддержк...
📆GigaChat Audio Day Nizhniy 🚀В начале октября ездили командой речевых технологий в Нижний Новгород с митапом. Поделились нашими разработками, познакомились с интересными ребятами и очень продуктивно провели время в столице закатов. ➡️Записи докладов уже доступны VK | YouTube 🔘Как мы сделали production ASR для новых языков на 10 часах данных (Андрей Кузьменко) 🔘Распознавание речи по спикерам в SaluteSpeech: от моделей и алгоритмов до production-оптимизаций (Никита Ноев и Михаил Кузьмин) 🔘Быс...