Поделюсь обновлениями проекта VseLLM! Кроме того, что это удобное единое окно API-доступа к различным передовым моделям (с ценами ниже Openrouter), теперь еще и наши юзеры получают бесплатный доступ к настроенному и готовому n8n-серверу. Достаточно иметь просто ключ с положительным балансом и запросить приглашение прямо в боте. С нашей платформой и n8n можно быстро собирать собственные AI-пайплайны на стабильной платформе с высокой отказоустойчивостью. Если вы работаете с LLM или автоматизацией ...
Роман с данными
Все о данных, ML, AI Founder LLM Arena. Ex-Founder TrainingData.Pro Окончил ВМК МГУ, 8 лет занимаюсь сбором и разметкой данных Контакты: @roman_kucev
Графики
📊 Средний охват постов
📉 ERR % по дням
📋 Публикации по дням
📎 Типы контента
Лучшие публикации
18 из 18Ура, наконец получил видео с выступления на Conversations! В докладе за 20 минут пояснил, почему бенчмарки лгут и как правильно оценивать LLM для бизнес-задач. Кстати, мой доклад стал лучшим по версии слушателей в техническом треке 🎉🎉🎉 В этом году Conversations…
Сходил на интервью к девочкам из N айтишниц — рассказал, как стал заниматься разметкой данных, и поделился самой интересной историей с работы про роботов-пылесосов 😀
Ура, наконец получил видео с выступления на Conversations! В докладе за 20 минут пояснил, почему бенчмарки лгут и как правильно оценивать LLM для бизнес-задач. Кстати, мой доклад стал лучшим по версии слушателей в техническом треке 🎉🎉🎉 В этом году Conversations снова пройдет 5 декабря в Москве. Вот что интересного для себя выделил в программе: • LLM для слов, MCP для цифр: как можно оптимизировать экономику проектов с помощью MCP-серверов — Иван Четвериков, Raft • AI-агенты ловят хакера: от э...
Лучшее, что я видел на этой неделе. Как перестать напевать эту песенку?😂😂😂
🔫 GenCode Mini Gallery Bench LLM Arena совместно с Сергеем Курбановым (руководитель направления RnD в компании MWS) рады представить новый бенчмарк. 📈 LLM стремительно эволюционируют и выходят на уровень AGENT-поведения, где модели решают задачи от анализа данных до полноценной разработки. На этом фоне особенно интересно посмотреть на то, как модели в режиме реального времени справляются даже с такими, на первый взгляд, простыми задачами вёрстки. GenCode Mini Bench не содержит выводов — только...
Ключевые выводы McKinsey из отчета The State of AI in 2025 о применении AI агентов 1. Большинство организаций всё ещё находятся на стадии экспериментов или пилотных проектов: две трети респондентов говорят, что их организации пока не начали масштабировать ИИ на уровне всей компании. 2. Высокий интерес к ИИ-агентам: 62% участников опроса отмечают, что их организации как минимум экспериментируют с ИИ-агентами. 3. Позитивные ранние сигналы влияния ИИ: Респонденты сообщают о выгодах по отдельным сце...
Жесть, зарубежная LMArena привлекла второй раунд в $150M под оценку $1.7B. Как думаете, под какую оценку мы в России можем в свою llmarena.ru привлечь инвестиции? Перевод поста LMArena в Х: Сегодня мы с радостью объявляем о привлечении 150 миллионов долларов в рамках раунда финансирования серии А при оценке компании в 1,7 миллиарда долларов — почти в 3 раза больше, чем в майском посевном раунде. С момента начала оценки в сентябре наш годовой объем потребления превысил 30 миллионов долл...
Один график из отчёта The State of AI in 2025 — и сразу понятно, где AI-агенты реально прижились. McKinsey разложили по полочкам: кто именно (по профессиям) и в каких индустриях их использует.
Продолжаю тестировать Comet. Как вы и просили: сделал прожарку ИИ браузера от Perplexity и дал самую интересную задачу - настроить проект по разметке в Яндекс.Заданиях. Что из этого вышло, смотрите на видео! 0:00-0:51 постановка задачи 0:52-14:31 работа ИИ агента 14:33-16:05 разбор полетов, проверка