Мой коллега Сева выкатил свежую статью на Хабре - про тестир — @sergeinotevskii

@sergeinotevskii4.2K подп.

2.2Kпросмотров

51.6%от подписчиков

2 марта 2026 г.

storyScore: 2.4K

Мой коллега Сева выкатил свежую статью на Хабре - про тестирование ai-сценариев и агентов. Внутри - конкретный путь от отсмотра ответов «глазками» до работающей системы бенчмарков, LLM-судей, Langfuse и конечно грабли которые мы собрали по дороге. Все это на примере реальных кейсов из прода. Читается за 9 минут, и есть что унести с собой. И уже по традиции: договорился, что Сева ответит на вопросы в комментах к этому посту - если что-то осталось непонятным или хочется уточнить детали реализации)

2.2K

просмотров

505

символов

Нет

эмодзи

Нет

медиа

Другие посты @sergeinotevskii

Датасет из веба (вэба/вёба/web) Ресерчил разные движки для поиска с LLM через API и посоветовали Par👁 3.4K Обычно переход с API (MaaS) на self-hosted подают как способ сэкономить. Но если смотреть на это из👁 3.2K Дипсик можно не ждать. Qwen опять выкатили модель, которую все будут использовать ближайшие полгода.👁 3.1K Кэш кэш кэш... Есть одна история, которая сильно влияет на экономику и скорость llm в проде и при эт👁 2.4K Никогда не участвовал в таких форматах мероприятий, но решил попробовать. 19–22 марта еду на кэмп S👁 2.3K

Все посты канала →

Аналитика канала База постов