⚡️LIMI (Less is More for Agency) — очередной разрыв шаблонов. Как-то пропустил этот пейпер, но прям зацепил. Всего 78 высококачественных примеров решения задач с траекториями использования тулов при фантюнинге ростят метрики на AgencyBench c 45 до 73%. Примеры собрали для 2 доменов Vibe Coding и Research Workflows. 1. Реальные запросы из практики (60 запросов): 2. Синтез запросов из GitHub Pull Requests Потом собрали качественные траектории для этих задач. Для каждого запроса аннотатор и GPT-5 р...
NLP Core Team
Канал команды NLP соre. Здесь мы делимся нашими результами и мыслями в области NLP/PLP и не только. Мы авторы многих моделей для русского языка: ruBert, ruGPT2, ruGPT3, ruT5, ruRoberta, FRED-T5.
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
16 из 16🫢🫢🫢40B модель IQuest-Coder-V1 бьёт Sonnet 4.5 на бенчмарках!? Новая модель от IQuestLab из Китая. 40B параметров, на многих бенчмарках показывает лучшие скоры и операжает Sonnet 4.5 и GPT 5.1. Правда сегодня метрики на странице HF уже 76.2 а не 81.4 на SWE-bench. Остальные метрики те же и в техрепорте тоже 81.4 на SWE-bench. Из основного про модель: 🧠 Code-Flow обучение — фокусируется не на статических файлах, а на динамической эволюции кода во времени. Основная идея: научить модель понимать...
🆕 Добавили в Koda обновленную флагманскую модель MiniMax-M2. Можно попробовать бесплатно! MiniMax M2 — обновленная флагманская языковая модель от компании MiniMax, ориентированная на использование в «агентах» и для программирования. Акцентируют внимание на трёх ключевых способностях: 🔴программирование 🔴использование инструментов (toolcalling) 🔴 глубокий поиск/поиск через данные Бьет по метрикам в коддинг предыдущего лидера из опенсорc - GLM 4.6. Так же уверенно опережает DeepSeek. Попробоват...
🆕 Вышел релиз Koda 0.4.0! Что нового? 🟣 Поддержка MCP — теперь можно подключать дополнительные возможности напрямую. 🟣 Переключение интерфейса на русский/английский язык. 🟣 Новый инструмент multi_edit_existing_file для редактирования файлов без apply model. Если заметите баги или захотите предложить новые фичи — пишите, мы всегда на связи 🙏 #release #minor
Gradient Accumulation Is Wasteful Миф: чем больше батчайз, тем стабильнее и лучше учится LLM. На самом деле всё не так. Авторы этой статьи провели мега-аблейшн по гиперпараметрам претрейна LLM и обнаружили: чем МЕНЬШЕ batch size, тем ШИРЕ диапазон гиперпараметров (lr, оптимизатор, decay-рейты), на которых модель нормально учится. Короче, на маленьком batch даже ванильный SGD (без momentum!) не уступает Adam-у и Adafactor. Валидационный лосс при этом не хуже, а иногда даже лучше, чем на больших b...
🚀Выпустили бенчмарк для замера моделей в области финансов и трейдинга! Помните, что мы еще трудимся над финансовой моделью в лаборатории ИИ «Финама». Мы проделали большую работу и у нас накопилось чем поделится. Первое с чего мы начали это создали бенчмарк, который всесторонне замерял бы модели в области финансов и сейчас про него. ✅ Собрали экзамен‑лайк бенчмарки: • CFA-like Level 1/2/3 — этика, учет, экономика, портфель, риск • CMT-like Level 2 — технический анализ, индикаторы, статистика ✅ П...
📊 Немного цифр про Koda — делимся тем, что происходит сейчас За последние месяцы продукт заметно подрос, и мы собрали несколько метрик, которые показывают, как им пользуются. 1. Больше 3 000 человек активно пользуются Koda каждый месяц. Это та аудитория, которая регулярно возвращается и работает с инструментом. А плагин для VS Code уже скачали больше 5 000 раз. 2. Около 1 млрд токенов трафика в день. Для сравнения: это сопоставимо с обработкой десятков тысяч страниц текста или большого количест...
😎 Мы закрыли свой первый инвестиционный раунд Это важный шаг, который напрямую ускорит развитие продукта: больше ресурсов — быстрее выходят фичи, стабильнее работают модели, активнее развивается агентный режим и Koda CLI. В первом раунде частным инвестором и стратегическим советником стал Виктор Тарнавский, Head of AI в Т-Банке. Спасибо всем, кто уже с нами — продукт растёт именно благодаря вашему фидбеку и активности. 📚 Подробности на Хабр: https://habr.com/ru/companies/koda/news/974842/ И оп...
🆕 Вышел релиз Koda 0.4.5! Что нового? Пожалуй самое приятное – модели KodaAgent и KodaChat стали работать заметно быстрее. Советуем попробовать их в деле! Помимо этого: 🟣 Добавили режим автопринятия изменений в агентном режиме — включайте в настройках и оставляйте агента решать комплексные задачи самостоятельно, без множества апрувов. ⚠️ Но будьте осторожны! Рекомендуем использовать этот режим в связке с Git'ом. Так вы всегда сможете восстановить предыдущее решение, если агент сделает не то, ч...
😎 Друзья, мы расширяемся! Если вы подумывали о том, чтобы сменить работу, то это прекрасная возможность 😊 Мы ищем Middle/Senior Fullstack Developer (AI Tools & CLI) 📍 Работа удалённо 💰 Уровень компенсации обсуждается индивидуально + возможен опцион О компании Koda (kodacode.ru) — инструмент для разработчиков, который интегрирует мощные AI-модели прямо в рабочий процесс: в редактор, CLI и внутренние инструменты команды. Мы делаем AI-ассистента, который помогает писать, рефакторить и анализиро...