Нейронка "тупит", галлюцинирует, придумывает факты, не выпол — @traiilway

658просмотров

5 февраля 2026 г.

📷 ФотоScore: 724

Нейронка "тупит", галлюцинирует, придумывает факты, не выполняет инструкции, допускает логические ошибки (в т.ч. противоречит сама себе), "забывает" контекст. Чем больше работаете с LLM, тем чаще сталкиваетесь с этим. Ухудшение симптомов особенно заметно в длинных диалогах - это известная проблема деградации качества: Context Degradation Syndrome (CDS) или long-chat degradation. Ограничение контекстного окна - основная техническая причина CDS. Но даже если модель поддерживает большое контекстное окно, увеличение объема входных данных приводит к нелинейному снижению способности модели извлекать релевантную информацию и следовать сложным инструкциям. При заполнении этого окна старая информация начинает обрезаться, что приводит к потере понимания ранних частей разговора. Есть хорошо задокументированный эффект “lost in the middle” (научная статья): когда релевантная информация находится в середине длинного ввода, качество резко хуже, чем если она в начале или в конце. Это объясняет типичный опыт в long-chat: вы “точно писали это раньше”, но оно было где-то в середине истории, и модель как будто не видит/не использует этот фрагмент. Когда модель не может стабильно извлечь релевантное из длинного контекста, она часто компенсирует пробелы генерацией наиболее правдоподобного продолжения (что вы воспринимаете как “придумывает факты”), а инструкции “теряются” среди конкурирующих требований внутри промпта/истории. Контекст в чате — как вид из окна поезда: едешь дальше, и старые места остаются позади и исчезают из виду; а если пейзажа слишком много, легко пропустить важное где-то посередине. Что делать? Для начала нужно сохранить контекст длинного диалога. Например, в Claude Code для подобных целей имеется контекстное сжатие “compaction” - оно показывает степень заполнения контекста и суммирует содержание прошлых диалогов. Не во всех продуктах это есть, поэтому работаем по следующей схеме: 1) После ~15-20 сообщений (или если признаки CDS замечены раньше) - отправляем этот промпт: TASK: Создай structured summary этой рабочей сессии: <conversation> [ВЕСЬ ДИАЛОГ] </conversation> Output Format: md (markdown) id: ctx_[YYYYMMDD]_[project]_[topic] created: [ISO timestamp] session_duration: [estimate] Session Summary: [Topic] Session Goal [Что хотели достичь] Completed [Задача 1] — [результат] [Задача 2] — [результат] In Progress [Задача] — [прогресс %] — [blocker if any] Decisions Made | ID | Decision | Rationale | Final | |----|----------|-----------|-------| | D1 | [что] | [почему] | ✓/○ | Technical Artifacts [urls, code snippets] Blockers [Blocker] — [impact] — [tried] Next Session [Конкретный next step 1] [Конкретный next step 2] Notes [Важные заметки, идеи, соображения] 2) Копируем результат (либо, например, в Perplexity можно выгрузить как markdown) 3) Открываем новый чат, загружаем саммари с шага 2 и отправляем вместе с этим промптом Context Loading Request Загрузи контекст для продолжения работы: <context> [SUMMARY CONTENT] </context> Действия: 1. Подтверди загрузку контекста 2. Кратко изложи понимание: - Цель проекта - Текущее состояние - Последние решения - Активные blockers 3. Перечисли next steps из summary Updates (если есть): [Новая информация с момента создания summary] Текущая задача: [Над чем будем работать] Вопросы (если есть неясности): [Что требует уточнения] АсфальтИИруем тропинки

Другие посты @traiilway