DeepSeek производит настоящую революцию в индустрии AI, предлагая экономичные крупные языковые модели, которые, по утверждениям компании, могут конкурировать с решениями таких гигантов, как OpenAI и Meta. Китайский стартап утверждает, что его флагманская модель рассуждений R1 демонстрирует «производительность, сопоставимую» с аналогичной моделью от OpenAI, а недавно выпущенная многомодальная модель Janus Pro якобы превосходит такие системы, как Stable Diffusion и DALL-E 3.
Конкурент ChatGPT от DeepSeek быстро занял верхние строчки в App Store, а сам стартап уже оказывает влияние на финансовые рынки. Так, акции Nvidia упали на 17 процентов, что привело к потерям почти 600 миллиардов долларов рыночной капитализации 27 января. Это, по версии CNBC, стало самым крупным падением за один день в истории американских фондовых рынков.
AI-ассистент DeepSeek работает на базе модели DeepSeek-V3, которая позволяет пользователям задавать вопросы, планировать поездки, генерировать текст и выполнять другие задачи. С увеличением числа скачиваний приложения компания была вынуждена ограничить регистрацию, ссылаясь на «вредоносные атаки».
Основанный в 2023 году Лянем Вэньфэном, DeepSeek привлек внимание благодаря созданию открытых AI-моделей, которые требуют гораздо меньших вложений и ресурсов, чем миллиарды, которые тратят такие компании, как OpenAI, Meta, Google, Microsoft и другие. Если все утверждения DeepSeek о производительности верны, это может доказать, что стартапу удалось разработать мощные AI-модели, несмотря на строгие американские экспортные ограничения, которые препятствуют продаже высокопроизводительных графических процессоров, таких как те, что производит Nvidia, в Китай.
Источник
Источник новости: habr.com