💭 Как управлять поведением LLM через поведенческий профиль? — @nado_razobratsya_ai

160просмотров

20 февраля 2026 г.

questionScore: 176

💭 Как управлять поведением LLM через поведенческий профиль? Роль разваливается, деградирует, не повышает эффективности… Звучит безнадёжно. 🫠 Но ведь на практике всё иначе: скажи модели «будь жёстким критиком» — она разнесёт твои аргументы. Скажи «распиши по-пацански» — ещё и объяснит, почему ты «дятел». 😳 Так что, роль всё-таки работает? ❗️Да. Но это не «личность» как глобальный инвариант поведения, а краткосрочный поведенческий профиль. Тебе в моменте говорят: «не будь конформным, не иди за толпой» — и ты на эмоциональной волне начинаешь идти против большинства. Но в долгую это не держится. Чтобы устойчиво не следовать толпе, нужен уже базовый характер, а не разовая установка. ================ 📑 Именно это исследуется в свежей статье “Calibrating Behavioral Parameters with Large Language Models”. Авторы сдвигают поведенческие параметры через профиль в промпте в одношаговом взаимодействии. Без длинного диалога, без накопления контекста. И в таком формате эффект оказывается статистически значимым. ⬇️Один из примеров — неприятие потерь (loss aversion): В статье используется профиль инвестора, для которого сохранение капитала важнее всего: он болезненно воспринимает убытки и склонен избегать риска. Результаты: ➖Базовая модель: λ = 1.12 ➖Человек (бенчмарк): λ = 2.25 ➖Калиброванная модель: λ = 3.0 ⏺️ λ показывает, насколько сильнее модель "боится" потерь по сравнению с "желанием" выиграть. ❗️Это означает, что профиль увеличивает чувствительность к потерям примерно в 2.7 раза по сравнению с baseline и делает модель примерно на треть более чувствительной, чем средний человек в том же тесте. ‼️ Практически это значит: в лотерее 50/50 модель с λ ≈ 3 будет ожидать выигрыш примерно в три раза больше потенциального проигрыша, чтобы согласиться на сделку. 🎯 Это уже не простая смена тона и стиля. Это изменение политики выбора. ================ Но как без подвохов? И вот один из них: Поведенческие параметры редко независимы. В статье анализировалось 8 параметров (стадность, неприятие потерь, импульсность, якорение и др.), и часть из них коррелируют между собой. Например, снижение следования толпе связано с ростом самоуверенности. Формулировка «не будь конформным» лингвистически легко превращается в «будь более уверенным». А поведенчески это разные вещи: ➖У человека независимость от толпы — это опора на собственный анализ с учетом внешних обсотятельств. ➖У модели — это часто просто усиление категоричности и игнорирование внешнего сигнала, даже если этот сигнал объективно сильный. Получается интересный эффект: мы хотим восстановить один поведенческий механизм, а модель воспроизводит ближайший по текстовым данным паттерн — уверенное отрицание. ➡️Итого: краткосрочные профили (задал "роль" и тут же получил действие - единоразово) действительно могут сильно и измеримо сдвигать поведение. Но это не «создание устойчивой личности», а временная настройка режима принятия решений — со всеми коррелирующими побочными эффектами. 💔

Другие посты @nado_razobratsya_ai