1.1Kпросмотров
5.1%от подписчиков
16 марта 2026 г.
question📷 ФотоScore: 1.2K
Илья, а какая нейронка лучше? Меня часто спрашивают (ахаха, да кто тебя спрашивает). Что лучше использовать, куда перейти, где зарегаться? Для бытовых вопросов сейчас любая нейросеть будет топ. Даже Алиса! Для рабочих задач на базовом уровне — тоже плюс-минус все равны. Тут на первое место выходит то, как вы сами разбираетесь в теме и умеете промптить. И вот у меня дико бомбит, когда выходит очередной релиз Gemini, ChatGPT или какого-нибудь китайца — Exeed, Chery, Qwen, Лисян — и про него сразу пишут, что это «очередной убийца рынка». Максимум этот убийца может убить репутацию автора, который так пишет. Почти любую нейросеть можно натренировать в узкой области, придумать для неё специальный тест — и именно в нём она будет рвать всех. Но обычные люди никогда так не сравнивают. И вот нашлись люди, которые решили эту проблему по-взрослому. Почти 1 000 учёных из 50 стран собрали 2 500 самых сложных задач по всему спектру знаний: математика, физика, биология, медицина, сноуборд или горные лыжи. При том уровень задач такой что «аспирант-не-справится». Причём если хоть одна нейросеть на этапе отбора отвечала правильно — вопрос выкидывали. Называется Humanity's Last Exam. Результаты? Год назад GPT-4o набрал жалкие 2.7%. Сейчас лидирует Gemini 3 Pro с ~38%, . За год прогресс из однозначных цифр в двузначные — но две трети вопросов модели всё ещё заваливают. Меня волнуют два вопроса:
Дойдём ли мы с таким темпом до 100% в этом году?
И что будет, когда дойдём?