Запрети нам носить использовать STONIC🤙 При поддержке ИЦИИ — @ikanam_ai

1.0Kпросмотров

8 декабря 2025 г.

📷 ФотоScore: 1.1K

Запрети нам носить использовать STONIC🤙 При поддержке ИЦИИ ИОН РАНХиГС и ИСП РАН представляем STONIC — динамический бенчмарк для измерения ценностных и нормативных предпочтений больших языковых моделей (LLM). STONIC - Schwartz-Theory Oriented Normative Integrity Check LLM всё чаще дают не только фактические ответы, но и нормативные оценки — что такое хорошо, что такое плохо и что на самом деле «правильно». Но по их ответам не всегда понятно, какими ценностями они руководствуются, мы же хотим сделать эти установки наблюдаемыми и измеримыми. Ключевая особенность: STONIC — динамический бенчмарк, который обновляется вместе с новостным потоком GDELT. Это помогает отслеживать, как мировоззренческое поведение моделей меняется во времени и в зависимости от повестки. Как работает STONIC: 1. Берём высказывания из GDELT 🌍 2. Аннотируем их ценностями по теории Шварца 3. Просим модель оценить согласие / несогласие 4. По ответам строим ценностный профиль модели Зачем это нужно: — анализ реакций моделей на чувствительные темы — сравнение по ценностным ориентирам, а не только по стандартным метрикам — аудит нормативного поведения LLM — основа для «мировоззренческого паспорта» моделей, где STONIC даёт измеримый ценностный компонент Наш репозиторий 💻 Наш бенчмарк на HuggingFace 🤗 Наш сайт @ikanam_ai

Другие посты @ikanam_ai