658просмотров
5 февраля 2026 г.
📷 ФотоScore: 724
Нейронка "тупит", галлюцинирует, придумывает факты, не выполняет инструкции, допускает логические ошибки (в т.ч. противоречит сама себе), "забывает" контекст. Чем больше работаете с LLM, тем чаще сталкиваетесь с этим. Ухудшение симптомов особенно заметно в длинных диалогах - это известная проблема деградации качества: Context Degradation Syndrome (CDS) или long-chat degradation. Ограничение контекстного окна - основная техническая причина CDS. Но даже если модель поддерживает большое контекстное окно, увеличение объема входных данных приводит к нелинейному снижению способности модели извлекать релевантную информацию и следовать сложным инструкциям. При заполнении этого окна старая информация начинает обрезаться, что приводит к потере понимания ранних частей разговора. Есть хорошо задокументированный эффект “lost in the middle” (научная статья): когда релевантная информация находится в середине длинного ввода, качество резко хуже, чем если она в начале или в конце. Это объясняет типичный опыт в long-chat: вы “точно писали это раньше”, но оно было где-то в середине истории, и модель как будто не видит/не использует этот фрагмент. Когда модель не может стабильно извлечь релевантное из длинного контекста, она часто компенсирует пробелы генерацией наиболее правдоподобного продолжения (что вы воспринимаете как “придумывает факты”), а инструкции “теряются” среди конкурирующих требований внутри промпта/истории. Контекст в чате — как вид из окна поезда: едешь дальше, и старые места остаются позади и исчезают из виду; а если пейзажа слишком много, легко пропустить важное где-то посередине. Что делать?
Для начала нужно сохранить контекст длинного диалога. Например, в Claude Code для подобных целей имеется контекстное сжатие “compaction” - оно показывает степень заполнения контекста и суммирует содержание прошлых диалогов. Не во всех продуктах это есть, поэтому работаем по следующей схеме: 1) После ~15-20 сообщений (или если признаки CDS замечены раньше) - отправляем этот промпт: TASK: Создай structured summary этой рабочей сессии:
<conversation>
[ВЕСЬ ДИАЛОГ]
</conversation> Output Format: md (markdown)
id: ctx_[YYYYMMDD]_[project]_[topic]
created: [ISO timestamp]
session_duration: [estimate]
Session Summary: [Topic]
Session Goal [Что хотели достичь] Completed
[Задача 1] — [результат]
[Задача 2] — [результат] In Progress
[Задача] — [прогресс %] — [blocker if any] Decisions Made
| ID | Decision | Rationale | Final |
|----|----------|-----------|-------|
| D1 | [что] | [почему] | ✓/○ | Technical Artifacts
[urls, code snippets] Blockers
[Blocker] — [impact] — [tried] Next Session
[Конкретный next step 1]
[Конкретный next step 2] Notes
[Важные заметки, идеи, соображения] 2) Копируем результат (либо, например, в Perplexity можно выгрузить как markdown) 3) Открываем новый чат, загружаем саммари с шага 2 и отправляем вместе с этим промптом Context Loading Request
Загрузи контекст для продолжения работы:
<context>
[SUMMARY CONTENT]
</context> Действия:
1. Подтверди загрузку контекста
2. Кратко изложи понимание: - Цель проекта - Текущее состояние - Последние решения - Активные blockers
3. Перечисли next steps из summary
Updates (если есть): [Новая информация с момента создания summary]
Текущая задача: [Над чем будем работать]
Вопросы (если есть неясности): [Что требует уточнения] АсфальтИИруем тропинки