OpenAI и Anthropic показали, насколько GPT-5 по качеству работы сравним с профессионалами в разных сферах

Все новости — Наука и технологии

2025-09-27T22:08:00Z

Raspberry Pi превратили в «премиальный настольный компьютер» за 200 долларов: Raspberry Pi 500+ — это мини-ПК, встроенный в клавиатуру

2025-09-27T21:58:55Z

Ученые оценили шансы на столкновение астероида 2024 YR4 с Луной и Землей

2025-09-27T21:27:00Z

Мобильная SoC Apple A19 от обычного iPhone 17 стала самым мощным процессором в мире в однопоточном режиме в PassMark

2025-09-27T21:03:06Z

Кириенко: в Абхазии впервые состоится конкурс Знание. Лектор

2025-09-27T21:02:29Z

День 28 сентября в истории

2025-09-27T20:28:00Z

Meta* объявила о создании открытой платформы для гуманоидных роботов

2025-09-27T20:19:00Z

OpenAI и Anthropic показали, насколько GPT-5 по качеству работы сравним с профессионалами в разных сферах

2025-09-27T20:02:00Z

Google DeepMind показала первую ИИ-модель для рассуждающих роботов: они анализируют задачи и делятся навыками между платформами

2025-09-27T20:00:00Z

Эти 6 вещей умный человек никогда не спросит: мудрость великих - запомните ее на всю жизнь

2025-09-27T19:29:20Z

Президент ОАЭ обсудил с главой OpenAI сотрудничество в сфере ИИ

2025-09-27T18:42:02Z

В Нью-Йорке найдена капсула времени с ужасающим предсказанием о конце эры людей

2025-09-27T18:31:01Z

Конкурс «Знание. Лектор» стартовал в Абхазии

2025-09-27T17:21:00Z

Так снимает Xiaomi 17 Pro: опубликованы реальные, а не рекламные фото, сделанные основной камерой смартфона

2025-09-27T16:10:58Z

Кириенко: в Абхазии стартует конкурс для лекторов

2025-09-27T15:55:51Z

Нижегородские врачи стали более лояльны к искусственному интеллекту

OpenAI и Anthropic показали, насколько GPT-5 по качеству работы сравним с профессионалами в разных сферах

2025-09-27T20:19:00Z


OpenAI представила результаты нового теста GDPval, который впервые попытался оценить, насколько возможности ИИ-моделей близки к профессиональному уровню в экономически значимых профессиях. Тест охватил 9 ведущих отраслей экономики США и 44 профессии — от инженеров и юристов до медсестёр и журналистов.

Суть GDPval в том, что опытные специалисты сравнивали отчёты и рекомендации, созданные человеком и ИИ, выбирая более качественные. Для специализированной версии GPT-5-high модель была признана равной или даже лучше экспертов в 40,6% случаев. Её конкурент Anthropic Claude Opus 4.1 занял 49% по похожему критерию, чему помогало более выразительное оформление графиков, хотя и не всегда высокое качество наполнения.

Эксперты от OpenAI подчёркивают, что результаты включают только ограниченный набор задач, поэтому говорить о полном замещении профессий пока что рано. Тем не менее, наблюдается тенденция растущей конкурентоспособности ИИ в сложных рабочих процессах, что позволит специалистам сосредотачиваться на творческих и стратегически важных задачах, делегируя рутинную часть в пользу автоматизации и моделей.

OpenAI планирует расширять тестирование, чтобы включать больше профессий и интерактивных случаев из реальной жизни.

Читайте также:

2025-09-27T20:02:00Z

Google DeepMind показала первую ИИ-модель для рассуждающих роботов: они анализируют задачи и делятся навыками между платформами

2025-09-26T15:44:11Z

Anthropic утроит международный штат сотрудников для продвижения ИИ

2025-09-25T10:01:43Z

Эксперты указали на опасность превращения ИИ в хрустальный шар инвестора

Каждый десятый инвестор советуется о покупке акций с такими нейросетями как ChatGPT и Gemini, пишет Reuters со ссылкой на исследование брокерской компании eToro.

2025-09-24T03:38:03Z

Акции Alibaba растут на 6% на планах увеличить инвестиции в ИИ-инфраструктуру

Котировки акций Alibaba взлетели на 7,8% на торгах в среду и достигли максимального уровня за четыре года на новости о том, что компания будет наращивать инвестиции в разработку искусственного интеллекта (ИИ).Китайский гигант в сфере интернет-ритейла анонсировал свою крупнейшую модель языка искусственного интеллекта Qwen3-Max, делая ставку на ИИ как на основную бизнес-стратегию, сообщает Reuters.

2025-09-24T09:21:08Z

Alibaba интегрирует ПО Nvidia Robotics в свою платформу ИИ