1.3Kпросмотров
89.4%от подписчиков
26 февраля 2026 г.
📷 ФотоScore: 1.4K
Одна из проблем больших языковых моделей заключается в том, что они склонны давать ответ даже тогда, когда честнее было бы сказать «я не знаю». Но, в-первых, такой ответ пользователей не впечатлил бы, и, во-вторых, технологически это не совсем тривиальная задачи. Питер Гостев, AI Capability Lead в Arena.ai (платформа для сравнения ИИ-моделей) создал «Bullshit Benchmark», чтобы тестировать склонность моделей отвечать даже на явно бессмысленные вопросы. Меньше всего разочаровал Claude. #ai
1.3K
просмотров
494
символов
Нет
эмодзи
Да
медиа

Другие посты @juristo_esperantisto

Все посты канала →
Одна из проблем больших языковых моделей заключается в том, — @juristo_esperantisto | PostSniper