Grok 4 обходит OpenAI и Google: новая модель ИИ от Маска выходит в лидеры

Все новости — Наука и технологии

2025-07-13T01:02:18Z

WSJ: SpaceX вложит $2 млрд в разработчика чат-бота Grok

2025-07-12T21:02:00Z

Жених не айти: россиянки рассказали, представителей каких профессий предпочитают в мужья

2025-07-12T21:00:01Z

Экранопланов громадье: как КНР доводит до ума наши разработки

2025-07-12T20:05:00Z

Китайские учёные открыли новый вид гигантского динозавра-зауропода

2025-07-12T20:02:00Z

Китайские ученые создали пчёл-киборгов

2025-07-12T19:58:00Z

Лёгкие эмбеддинги вместо тяжёлых снимков: ИИ-архитектура стартапа Lgnd позволит анализировать спутниковые данные моментально

2025-07-12T19:54:00Z

Чтобы стать лучшим конкурентом для Nvidia компания Huawei будет подстраиваться под Nvidia. ИИ-процессоры Ascend получат поддержку CUDA через промежуточное ПО

2025-07-12T18:44:00Z

NASA выбрало три прибора для исследования Луны в рамках программы Artemis

2025-07-12T18:06:00Z

Космический телескоп «Джеймс Уэбб» отпраздновал трёхлетие научной работы захватывающим снимком туманности Кошачья Лапа

2025-07-12T17:56:00Z

Уникальный лунный базальт переворачивает представления о тепловой эволюции Луны

2025-07-12T17:43:00Z

Учёные «приручили» жидкое зеркало толщиной в миллиметр для гигантских космических телескопов

2025-07-12T17:14:00Z

Складной iPhone тоже появится на рынке

2025-07-12T17:06:50Z

xAI Илона Маска может быть оценена в $200 млрд в рамках нового раунда финансирования

2025-07-12T16:39:00Z

Японские ученые установили мировой рекорд скорости передачи данных: 1 петабит в секунду

2025-07-12T15:10:00Z

27 экзопланет проверили новым методом: учёные Breakthrough Listen проанализировали данные, когда планеты скрывались за своими звёздами

Grok 4 обходит OpenAI и Google: новая модель ИИ от Маска выходит в лидеры

2025-07-11T06:45:00Z


Илон Маск и его компания xAI объявили о запуске новой флагманской языковой модели Grok 4 и премиального тарифа SuperGrok Heavy стоимостью $300 в месяц. Модель уже доступна пользователям социальной сети X и демонстрирует лидерство в ключевых бенчмарках. Grok 4 впервые позволил xAI опередить таких гигантов, как OpenAI, Google и Anthropic.

Согласно данным xAI, Grok 4 стал первой моделью, не входящей в условную «большую тройку» разработчиков ИИ, которая возглавила рейтинг Intelligence Index от Artificial Analysis, набрав 73 балла. Для сравнения: OpenAI o3 получил 70, Google Gemini 2.5 Pro — тоже 70, а Anthropic Claude 4 Opus — 64.

Кроме того, Grok 4 показал впечатляющие результаты в отдельных тестах: 94% в математическом AIME 2024 и 88% в GPQA Diamond, которые оценивают способность модели к логическим рассуждениям. Новая версия также обладает способностью анализировать изображения и выполнять вызовы функций. Хотя Илон Маск признал, что мультимодальный режим пока далёк от идеала, xAI обещает улучшения в будущих версиях.

Особое внимание вызвал результат модели на тесте ARC-AGI — одном из самых строгих бенчмарков, предназначенных для оценки гибкого интеллекта. По словам команды ARC, Grok 4 набрал 15.9% в ARC-AGI-2, установив новый рекорд и впервые преодолев порог статистического шума, установленного на уровне 10%. Для сравнения, предыдущий лидер — Claude Opus 4 — набрал лишь около 8%. Grok 4 также стал первым коммерческим ИИ, обогнавшим специализированные модели с платформы Kaggle.

Компания также представила Grok 4 Heavy — «мультиагентную» версию модели, в которой несколько агентов работают параллельно и сравнивают свои ответы. Именно эта версия показала лучший результат на тесте Humanity’s Last Exam (44.4% с инструментами), обогнав Gemini 2.5 Pro (26.9%) и OpenAI o3 (21%).

Однако не обошлось без скандалов: запуск Grok 4 совпал с отставкой CEO X Линды Яккарино и инцидентом, в котором официальный аккаунт Grok в соцсети X опубликовал антисемитские высказывания. После этого xAI удалила из системного промпта модельную инструкцию, разрешающую «политически некорректные» ответы.

Несмотря на это, xAI делает ставку на коммерческий успех. Стоимость Grok 4 составляет $3 за миллион входящих и $15 за миллион исходящих токенов — аналогично Claude Sonnet, но дороже, чем у Gemini и o3. Скорость генерации — 75 токенов в секунду, что меньше, чем у конкурентов, но выше, чем у Claude Opus.

Контекстное окно Grok 4 — 256 тысяч токенов, что уступает 1 миллиону у Gemini 2.5 Pro, но превышает лимиты у большинства других моделей.

Читайте также:

2025-07-01T19:21:00Z

Роботы учатся управлять собой сами: MIT создал систему управления без программирования

2025-07-12T17:06:50Z

xAI Илона Маска может быть оценена в $200 млрд в рамках нового раунда финансирования

2025-07-07T13:35:00Z

ChatGPT занял второе место в симуляции управления космическим аппаратом

2025-07-10T07:05:55Z

Миллиардер Маск и xAI представили «самый продвинутый в мире» чат-бот Grok 4

Маск и основанный им ИИ-стартап xAI представили новую версию чат-бота Grok 4. Миллиардер назвал его «самым продвинутым ИИ в мире», который уже скоро будет способен открывать новые законы физики, необходимые для колонизации Марса

2025-07-12T00:01:08Z

В США заявили, что Grok ссылается на Маска при ответах на сложные вопросы

Чат-бот Grok 4 на основе искусственного интеллекта (ИИ) при поиске ответов на чувствительные вопросы ссылается на посты бизнесмена Илона Маска — главу компании xAI, разработчика Grok 4.