категории | RSS

DeepSeek торопится выпустить новую модель R2

По некоторым данным, выпуск R2, изначально запланированный на май, может состояться значительно раньше. Компания не раскрывает деталей, но известно, что модель получит улучшенные возможности программирования и расширенную поддержку многоязычного анализа. DeepSeek воздерживается от комментариев по поводу ускоренных сроков разработки.

Новая реальность для ИИ-отрасли

Прорыв DeepSeek кардинально меняет баланс сил в индустрии. Несмотря на использование менее мощных чипов Nvidia, модель R1 смогла составить конкуренцию решениям крупнейших разработчиков. Компания доказала, что можно создавать мощные ИИ-модели при меньших затратах. Это заставило другие компании ускорить свои разработки и сломало монополию ведущих игроков.

Вашингтон напряженно следит за создавшейся ситуацией. Известно, что в США технологическое лидерство в ИИ считается стратегическим приоритетом. Вполне возможно, что по результатам «наблюдений», американцы введут новые ограничения на поставки вычислительных компонентов в Китай. Тем временем китайские корпорации уже начали интеграцию моделей DeepSeek в свои продукты, усиливая влияние компании.

Стратегия с нестандартным подходом

Несмотря на стремительный успех, основатель DeepSeek Лян Вэньфэн остается загадочной фигурой. Разбогатев, он практически исчез из публичного пространства в 2024 году. Кроме того, рабочие процессы в компании отличаются от принятых в китайских корпорациях: вместо жестких иерархий и изнурительных рабочих часов сотрудники работают в гибкой среде, получая высокие зарплаты и свободу в исследованиях.

Лян делает ставку не на массовую коммерциализацию, а на фундаментальные исследования. Его инвестиционный фонд High-Flyer финансирует передовые разработки и предоставляет DeepSeek доступ к мощным вычислительным ресурсам.

Секрет успеха в вычислительных мощностях

Ключевым фактором успеха DeepSeek стал доступ к вычислительным мощностям. High-Flyer начал собирать кластеры суперкомпьютеров задолго до создания DeepSeek, что стало решающим преимуществом, когда США ввели санкции против Китая. Компания активно использует передовые архитектуры, такие как Mixture-of-Experts (MoE) и Multihead Latent Attention (MLA), что значительно снижает затраты на вычисления. Аналитики оценивают, что модели DeepSeek обходятся в 20–40 раз дешевле, чем аналоги от OpenAI.

Реакция на новинку в Китае и мире

По мере роста DeepSeek реакция мировых регуляторов становится все более неоднозначной. Австралия, Италия и Тайвань запретили использование приложения DeepSeek на всех правительственных устройствах/ По официальной версии это произошло из-за проблем с конфиденциальностью. Эксперты IT-World предполагают, что если модели DeepSeek будут использоваться в китайских государственных структурах, то это может привести и к новым санкциям со стороны США.

Пекин, в свою очередь, все больше поддерживает DeepSeek. Китайские корпорации Baidu, Tencent и Lenovo, уже начали интеграцию моделей DeepSeek в свои сервисы.

Между тем, xAI, основанная Илоном Маском, представила свою новую модель искусственного интеллекта — Grok 3. По предварительным данным, эта нейросеть намного мощнее, чем известные модели, такие как Gemini 2 Pro от Google DeepMind, DeepSeek V3, Claude 3.5 от Anthropic и даже GPT-4o от OpenAI. Читайте также Кто дотянет до финиша в гонке ИИ? Искусственный интеллект переписывает правила, а Китай и США ведут ожесточённую гонку за лидерство. Миллионы инвестиций, технологические прорывы, растущие ставки — кто окажется впереди? Аналитический экскурс IT-World погружает в этот захватывающий мир, где даже самые смелые прогнозы напоминают детективный сюжет.



Источник новости: www.it-world.ru

DimonVideo
2025-02-27T12:42:02Z

Здесь находятся
всего 0. За сутки здесь было 0 человек
Яндекс.Метрика