Бенчмарк Tencent выявил неспособность ИИ-моделей использоват — @iFinTechNews

@iFinTechNews1.2K подп.

184просмотров

15.6%от подписчиков

7 февраля 2026 г.

📷 ФотоScore: 202

Бенчмарк Tencent выявил неспособность ИИ-моделей использовать контекст Tencent и Фуданьский университет представили CL-bench — открытый бенчмарк, который оценивает умение языковых моделей извлекать знания из предоставленного контекста, а не полагаться на данные из обучения. Тесты показали тревожно низкие результаты: даже самая мощная модель GPT-5.1 правильно решала лишь около четверти задач, несмотря на то, что вся необходимая информация была явно указана в контексте.

184

просмотров

473

символов

Нет

эмодзи

Да

медиа

Другие посты @iFinTechNews

Защищенный квантовым шифрованием интернет испытали на расстоянии 100 км Китайские физики установили👁 251 Sony запантетовала геймпад с тачскрином для выбора расположения кнопок Sony получила патент США на👁 250 Китайский токамак удержал плазму на протяжении 22 минут Шанхайский стартап Energy Singularity устан👁 249 Ученые вырастили кристалл для рекордного твердотельного лазера Ученые из Китайской академии наук со👁 246 Геотермальная энергия превзойдет по эффективности АЭС, ископаемое топливо и ВИЭ Усовершенствованные👁 245

Все посты канала →

Аналитика канала База постов