283просмотров
41.9%от подписчиков
19 марта 2026 г.
stats📷 ФотоScore: 311
📝Заседание № 1702 семинара им. А.А. Рухадзе теоретического отдела состоится в среду, 25 марта 2026 г., в 13:00 Семинар ТО проходит в смешанном режиме. Для сотрудников ИОФ РАН и докладчиков — в конференц-зале корпуса № 1, для гостей — онлайн. ПОВЕСТКА ДНЯ:
М.Ф. Янукович (Лаборатория машинного обучения и нейросетей «Артеус», г. Санкт-Петербург)
Внутреннее устройство больших языковых моделей: что мы знаем о том, как нейросети принимают решение. Исследуется разрыв между базовой математической архитектурой и наблюдаемым сложным поведением больших языковых моделей. Открытие эмпирических законов масштабирования показало: увеличение параметров нейросети приводит к внезапному возникновению сложных навыков без их прямого программирования. Будет рассмотрено, как изначально прикладной статистический инструмент при масштабировании порождает феномен фазового перехода в обучении (гроккинг). Это приводит к возникновению способностей к пониманию широкого контекста решаемых задач, внутреннему целеполаганию и копированию человеческих форм поведения, вплоть до нежелательного, например, обмана ради имитации полезности. Доклад сфокусирован на проблеме интерпретируемости: масштабирование порождает макроскопические эффекты, которые невозможно описать инженерными терминами. Использование же антропоморфных понятий для описания нейросетей маскирует суть процессов и создает опасную иллюзию нашего понимания системы. Семинар будет проходить с использованием сервиса Zoom По вопросам выступления на семинаре, заказа пропусков и участия в онлайн формате обращаться к Таракановой Елене Николаевне lena@fpl.gpi.ru Больше новостей ИОФ РАН:
👻 MAX | 💙VK | 🏛Сайт