категории | RSS

DeepSeek и её модель рассуждений R1: что говорят эксперты и потребители

С тех пор как китайская компания DeepSeek, занимающаяся искусственным интеллектом, выпустила открытую версию своей модели рассуждений R1 в начале этой недели, многие представители технологической отрасли делают громкие заявления о том, чего добилась компания и что это значит для развития AI.

Венчурный инвестор Марк Андриссен, например, написал, что DeepSeek — «один из самых удивительных и впечатляющих прорывов, которые я когда-либо видел».

R1, по-видимому, соответствует модели o1 от OpenAI или превосходит её по некоторым показателям AI. И компания утверждает, что обучение одной из её моделей стоит всего 5,6 миллиона долларов по сравнению с сотнями миллионов долларов, которые ведущие американские компании тратят на обучение своих моделей.

Похоже, что компания добилась этого, несмотря на санкции США, которые запрещают продажу передовых чипов китайским компаниям. The MIT Technology Review пишет, что успех компании показывает, как санкции «заставляют такие стартапы, как DeepSeek, внедрять инновации, которые ставят во главу угла эффективность, объединение ресурсов и сотрудничество». С другой стороны, The Wall Street Journal сообщает, что Лян Вэньфэн из DeepSeek недавно заявил премьер-министру Китая, что ограничения на экспорт из США по-прежнему создают препятствия.

Генеральный директор Curai Нил Хосла предложил более простое объяснение, заявив, что компания — это «государственная пропаганда», которая «притворяется, что затраты были низкими, чтобы оправдать низкую цену, и надеется, что все перейдут на неё, чтобы подорвать конкурентоспособность AI в США».

Тем временем журналист Хольгер Цшаепиц предположил, что DeepSeek «может представлять наибольшую угрозу для фондовых рынков США» — если китайская компания сможет создать передовую модель по низкой цене, не имея доступа к современным чипам, это поставит под сомнение «целесообразность сотен миллиардов долларов, вложенных в эту отрасль».

В ответ генеральный директор Y Combinator Гарри Тан заявил, что успех DeepSeek на самом деле пойдёт на пользу его американским конкурентам. «Если обучение моделей станет дешевле, быстрее и проще, — написал он в X, — спрос на вывод, реальное применение AI в реальном мире будет расти и ускоряться ещё быстрее, что гарантирует, что вычислительные мощности будут использоваться».

А главный научный сотрудник Meta* по искусственному интеллекту Ян Лекун возразил против того, чтобы рассматривать заявление DeepSeek через призму отношений между Китаем и Соединёнными Штатами. По его мнению, суть проблемы не в геополитических аспектах, а в том, что открытые модели превосходят проприетарные.

«DeepSeek извлекла выгоду из открытых исследований и открытого исходного кода, например, PyTorch и Llama от Meta, — написал ЛеКун в LinkedIn на этой неделе. — Они придумали новые идеи и построили их на основе работ других людей. Поскольку их работа опубликована и имеет открытый исходный код, каждый может извлечь из неё выгоду».

Судя по всему, все эти споры побуждают потребителей попробовать продукт. По состоянию на воскресенье днём AI-помощник DeepSeek является самым популярным бесплатным приложением в Apple App Store, опережая ChatGPT.

*Meta и её продукты (Instagram, Facebook) запрещены на территории Российской Федерации.

Источник



Источник новости: habr.com

DimonVideo
2025-01-27T12:50:03Z

Здесь находятся
всего 0. За сутки здесь было 0 человек
Яндекс.Метрика