категории | RSS

«Сэму Альтману пока не о чем беспокоиться»: Grok-3 не обгоняет топовые решения OpenAI

В понедельник Илон Маск презентовал Grok-3 — новую версию чат‑бота от xAI, заявив, что он «на порядок мощнее» своей предыдущей версии. Некоторые эксперты и исследователи ИИ протестировали Grok-3 и дали неоднозначные отзывы.

Маск утверждает, что новый бот превосходит GPT-4o от OpenAI, а также решения от Google, DeepSeek и Anthropic по ключевым показателям в математике, науке и программировании. «Мы ежедневно улучшаем модели, и буквально за 24 часа вы сможете увидеть прогресс», — заявил Маск во время прямой трансляции на платформе X, где его сопровождали три инженера xAI.

Андрей Карпатый, сооснователь OpenAI и бывший руководитель ИИ‑направления в Tesla, отметил в посте на X, что Grok-3 успешно справляется с поиском сложной информации в обучающих материалах, однако, подобно OpenAI o1-pro, он испытывает затруднения при решении хитроумных партий в крестики‑нолики. «В целом создаётся впечатление, что этот уровень сопоставим с o1-pro и немного опережает DeepSeek‑r1. Но конечно, нужны более детальные тесты», — добавил Карпатый, который одним из первых получил доступ к Grok-3.

Одновременно xAI представила новый инструмент для Grok-3 — DeepSearch, который должен улучшить работу с исследованиями, мозговыми штурмами и анализом данных, объясняя при этом процесс обработки запросов. По данным Business Insider, стартап разрабатывал этот инструмент как минимум с конца прошлого года. Карпатый отметил, что DeepSearch «примерно сопоставим с DeepResearch от Perplexity, что уже неплохо, но всё же уступает недавно выпущенному OpenAI Deep Research, который кажется более детализированным и надёжным».

Итан Моллик, профессор Уортонской школы бизнеса при Пенсильванском университете, изучающий ИИ, считает, что, несмотря на быстрый рост xAI, Grok-3 пока не стал явным лидером: «Очень достойная модель на передовой, но не та, ради которой вы бы отказались от своей текущей», — написал он в LinkedIn в понедельник. Итан добавил, что Grok-3 действительно обходит некоторые модели OpenAI по отдельным метрикам, но не даёт явного преимущества перед o3.

Гэри Маркус, основатель Geometric Intelligence и давний скептик в отношении шумихи вокруг ИИ, отнёсся к новому боту с сомнением: «Илон Маск пообещал, что Grok-3 станет самым умным ИИ в истории. Спойлер: не стал». Он назвал презентацию «копией предыдущих демонстраций» и отметил, что, несмотря на определённый прогресс, революционного прорыва по сравнению с моделями OpenAI не произошло.

Карпатый, напротив, был настроен позитивнее, охарактеризовав логические способности Grok-3 как «передовые» и подчеркнув его умение справляться со сложными задачами в программировании.Маск против Альтмана

Выход Grok-3 произошёл на фоне растущего противостояния между Маском и Сэмом Альтманом, генеральным директором OpenAI: их конкуренция усилилась в этом месяце, когда Маск попытался приобрести контроль над OpenAI, предложив 97,4 млрд $ без предварительных переговоров. В 2015 году он сам участвовал в создании компании вместе с Альтманом, но спустя три года ушёл из‑за разногласий. На прошлой неделе совет директоров OpenAI отклонил его предложение.

Моллик отметил, что, несмотря на технологические успехи xAI, OpenAI сохраняет серьёзное преимущество за счёт индустриальных партнёрств и широкого распространения среди корпоративных клиентов, написав: «Не уверен, что Grok получит значительный шанс на рынке». Маркус выразил ещё большее сомнение: «Сэму Альтману пока не о чем беспокоиться. Прорыва нет», — заявил он, добавив, что OpenAI остаётся недосягаемым лидером благодаря доступу к вычислительным ресурсам и масштабам своих исследований.

Маск, в свою очередь, утверждает, что Grok-3 получил более чем десятикратное увеличение вычислительной мощности по сравнению с предыдущей версией и завершил предварительное обучение в начале января. Новая модель уже доступна подписчикам X Premium+, а xAI также запустила новый тариф — SuperGrok, предназначенный для пользователей мобильных устройств и сайта grok.com. Маск добавил, что компания планирует открыть исходный код предыдущих версий моделей, как только Grok-3 достигнет зрелости — по его прогнозам, это случится через несколько месяцев.

Источник.



Источник новости: habr.com

DimonVideo
2025-02-19T06:50:02Z

Здесь находятся
всего 0. За сутки здесь было 0 человек
Яндекс.Метрика