«Ты несешь буллшит» - новый бенчмарк оценивает LLM с их возм — @neurovibe_ai

@neurovibe_ai2.4K подп.

1.0Kпросмотров

41.4%от подписчиков

26 февраля 2026 г.

📷 ФотоScore: 1.1K

«Ты несешь буллшит» - новый бенчмарк оценивает LLM с их возможности выявлять бессмысленные и глупые промпты. Одна из ключевых проблем LLM - поддакивание, даже в абсурдных вещах. Другая проблема - моделей много, бенчей много, каждый вендор LLM показывает, что его модель лучше всех. На мой взгляд этот бенч отражает интеллектуальный разрыв между моделями Anthropic и, как недавно выяснилось, дистиллированными от них китайскими моделями. Ведь критический взгляд - показатель развитого интеллекта. #benchmark #llm @neurovibe_ai

1.0K

просмотров

534

символов

Нет

эмодзи

Да

медиа

Другие посты @neurovibe_ai

Проект LMarena (оценка $1.7 млрд) работает по принципу поединка: юзер пишет промпт, сервис случ👁 1.2K Новая модель Gemini 3.1 Pro похоже лучшая на сегодня по созданию сайтов и визуала. Просто посмотри👁 1.2K 👁 1.2K GitNexus строит граф из кодовой базы проектов и улучшает качество работы Claude Code до 70%! В сети👁 1.2K Новая модель Гугла Nano Banana 2 для генерации и редактирования изображений... Без комментариев, про👁 1.1K

Все посты канала →

Аналитика канала База постов