Один timestamp, один round-robin, один плавающий список tool — @habr_ai

@habr_ai979 подп.

44просмотров

4.5%от подписчиков

30 марта 2026 г.

Score: 48

Один timestamp, один round-robin, один плавающий список tools: 7 анти-паттернов, которые убивают префикс кэша LLM Кэширование включено, а cached_tokens всё равно не растут? Часто проблема не в модели и не в провайдере. Hit rate обычно режут совсем другие вещи: timestamp в начале запроса, плавающий порядок tools, разные реплики, RAG с нестабильным порядком чанков и слишком короткая жизнь KV-кэша. В статье разбираю 7 типовых анти-паттернов, которые убивают prefix_cache_hit в проде. Читать далее #prefix_cache #искусственный_интеллект #vllm #openai #anthropic #maas #self_hosted #prompt_engineering #context_engineering #agents | @habr_ai

просмотров

642

символов

Нет

эмодзи

Нет

медиа

Другие посты @habr_ai

Да-машина: почему ваш AI никогда не скажет что код — отстой Пользователь спросил ChatGPT про бизнес👁 58 Как агенты видят веб-страницы Так как типичная LLM обучена работать с  текстом, первые попытки👁 57 Kimi K2.5 наступает на пятки GPT-5.4. И работает из России без VPN Бенчмарков сейчас – как нейросет👁 51 [Перевод] Как ИИ попал в нашу питьевую воду. И почему никто не знает, что с этим делать В 2025 году👁 50 Конец преимущества корпораций: как вайбкодинг уравнял малый бизнес с энтерпрайзом в автоматизации П👁 50

Все посты канала →

Аналитика канала База постов