Менее чем за два года с момента своего запуска компания xAI представила Grok 3 — одну из самых передовых AI-моделей на сегодняшний день. Эта модель соответствует или превосходит лучшие аналоги по ключевым показателям и оценкам пользователей в Chatbot Arena, причём её обучение ещё не завершено.
Информации о Grok 3 пока немного, так как команда не опубликовала статью или технический отчёт. Однако на основе презентации xAI и экспериментов, проведённых AI-экспертами, можно предположить, как Grok 3 повлияет на AI-индустрию в ближайшие месяцы.
С ростом конкуренции между AI-лабораториями (например, после выпуска DeepSeek-R1) можно ожидать, что циклы релизов станут короче. На презентации Grok 3 Илон Маск, основатель xAI, отметил, что пользователи могут “замечать улучшения практически каждый день”, поскольку модель совершенствуется непрерывно.
“Конкурентное давление со стороны DeepSeek и Grok на фоне меняющейся политической ситуации, как внутри страны, так и на международной арене, заставит ведущие AI-лаборатории выпускать модели быстрее. Увеличение конкуренции и ослабление регулирования приведут к тому, что пользователи получат более мощные AI быстрее”, — пишет Натан Ламберт, специалист по машинному обучению в Институте AI Аллена.
С одной стороны, это хорошо для пользователей: они получают доступ к новейшим моделям постоянно, вместо того чтобы ждать месяцами. С другой стороны, это создаёт нестабильность для разработчиков, рассчитывающих на предсказуемое поведение моделей. Исследования и опыт показывают, что разные версии одной и той же модели могут по-разному отвечать на одинаковые запросы. Чтобы избежать сбоев, предприятиям рекомендуется разрабатывать собственные тесты и регулярно проверять новые обновления.
Недавний выпуск DeepSeek-R1 поставил под сомнение огромные инвестиции крупных компаний в вычислительные кластеры. Однако быстрый успех xAI доказывает оправданность вложений в AI-ускорители. Grok 3 был обучен в рекордно короткие сроки благодаря суперкомпьютеру Collosus xAI, расположенному в Мемфисе.
“Точных данных у нас нет, но можно с уверенностью сказать, что масштабирование всё ещё помогает улучшать производительность, хотя, возможно, не уменьшает расходы. Стратегия xAI заключалась в том, чтобы как можно быстрее задействовать самый мощный кластер. Пока нет подробностей, можно предположить, что масштабирование сыграло свою роль, но большинство достижений Grok может объясняться не только этим, — пишет Ламберт.
Некоторые аналитики считают, что успех Grok 3 связан с масштабированием вычислительных мощностей xAI. Однако Маск намекнул, что здесь есть и другие важные факторы, помимо масштабирования. Чтобы узнать все подробности, нужно дождаться официальной публикации.
В AI-сообществе усиливается тенденция к открытию исходного кода больших языковых моделей (LLM). xAI уже открыла исходный код Grok 1. По словам Маска, политика компании заключается в том, чтобы открывать все модели, кроме последней версии. Таким образом, когда Grok 3 будет полностью выпущен, Grok 2 станет общедоступным. (Сэм Альтман из OpenAI также рассматривает возможность открыть некоторые модели).
Кроме того, xAI не будет полностью раскрывать цепочку размышлений Grok 3 (chain-of-thought, CoT), чтобы конкуренты не могли её скопировать. Вместо этого xAI предоставит подробное описание процесса рассуждений, как это сделала OpenAI с o3-mini. Полная цепочка CoT будет доступна только после открытия исходного кода Grok 3, что, вероятно, произойдёт после релиза Grok 4.
Несмотря на впечатляющие результаты тестов, отзывы о Grok 3 остаются смешанными. Бывший учёный OpenAI и Tesla AI Андрей Карпати отметил, что способность Grok 3 к рассуждению находится “примерно на уровне передовых моделей” вроде o1-Pro, но при этом модель уступает в некоторых задачах, таких как создание масштабируемых векторных изображений или решение этических вопросов.
Другие пользователи отмечают, что Grok 3 уступает конкурентам в программировании, хотя она также демонстрирует впечатляющие навыки кодирования в ряде случаев.
Источник новости: habr.com