26просмотров
26.8%от подписчиков
26 сентября 2025 г.
📷 ФотоScore: 29
🤖OpenAI представила GDPval — бенчмарк для оценки экономического влияния ИИ OpenAI разработала GDPval — бенчмарк для измерения реального влияния искусственного интеллекта на экономику. В отличие от традиционных тестов, таких как MMLU, которые оценивают знания на основе коротких вопросов, GDPval фокусируется на выполнении практических рабочих задач, соответствующих реальным профессиональным обязанностям. Бенчмарк включает 1 320 заданий, охватывающих 44 профессии в девяти отраслях, которые в совокупности формируют более 5% ВВП США. К ним относятся: юриспруденция, финансы, инженерия, здравоохранение, консалтинг, образование, управление проектами, маркетинг и администрирование. Задачи разработаны практиками с средним стажем 14 лет. Формат соответствует реальным рабочим сценариям: — написание правовой записки, — доработка технического чертежа, — подготовка аналитической таблицы или презентации, — составление отчета по финансовым данным. Оценка качества выполнения проводится методом слепого сравнения: решения, созданные ИИ и профессионалами, оцениваются экспертами по единым критериям без указания источника. Первые результаты показали, что среди протестированных моделей лучшие результаты показали: — Claude Opus 4.1 — по общему качеству и оформлению, — GPT-5 — по точности и глубине анализа. Обе модели приблизились к качеству решений, предоставляемых профессионалами, в ряде задач. OpenAI отмечает, что в отдельных случаях ИИ способен выполнять задачи в десятки раз быстрее и с меньшими затратами, чем человек. GDPval предназначен для использования компаниями и разработчиками как инструмент для оценки потенциала автоматизации в различных профессиональных сферах. Цель — определить, какие задачи и профессии могут быть наиболее эффективно трансформированы за счет внедрения ИИ. 🔍 Вывод: GDPval — первый систематизированный инструмент, который измеряет не потенциал ИИ, а его реальную производительность в рабочих процессах, формирующих экономику. Он показывает, какой ИИ полезнее и уже становится ясно — ИИ не просто помогает. Он меняет структуру труда — и те, кто начнёт использовать его как стандартный инструмент, получат решающее преимущество. #НейроТочка #ИИ #НовостиИИ #экономика #GDPval #OpenAI #автоматизация @nejrotochka 🤖 НейроТочка в ВК
26
просмотров
2273
символов
Да
эмодзи
Да
медиа

Другие посты @nejrotochka

Все посты канала →