Китайская лаборатория представила одну из первых моделей искусственного интеллекта (ИИ), способных к «рассуждению», которая, по их словам, может составить конкуренцию o1 от OpenAI.Изображение: DeepSeek
В среду компания DeepSeek, занимающаяся исследованиями в области ИИ, анонсировала предварительную версию DeepSeek-R1. По заявлению компании, эта модель способна наравне с OpenAI o1-preview выполнять задачи, требующие логического мышления.Особенности "рассуждающих" моделей
В отличие от большинства существующих ИИ, такие модели могут эффективно «проверять свои выводы», затрачивая больше времени на анализ вопроса или задачи. Это помогает им избегать типичных ошибок, часто возникающих у других моделей.
Как и OpenAI o1, DeepSeek-R1 способен «обдумывать» задачи, строить планы и выполнять последовательность действий для достижения ответа. Этот процесс может занимать десятки секунд в зависимости от сложности запроса.
DeepSeek утверждает, что DeepSeek-R1 (точнее, его версия DeepSeek-R1-Lite-Preview) демонстрирует сопоставимые результаты с o1-preview на двух популярных бенчмарках для ИИ: AIME и MATH. AIME оценивает производительность модели с помощью других ИИ, а MATH представляет собой сборник текстовых задач.
Тем не менее, модель пока не совершенна. Некоторые пользователи в X отметили, что DeepSeek-R1 испытывает трудности с играми на проверку логического мышления, такими как крестики-нолики, — аналогичная проблема наблюдается и у o1.Уязвимость и цензура
DeepSeek-R1 легко поддается джейлбрейку, то есть может быть «обманута» запросами, которые заставляют игнорировать встроенные ограничения. Один из пользователей X сумел получить от модели подробный рецепт изготовления запрещенных веществ.
Кроме того, DeepSeek-R1 блокирует запросы, связанные с политически чувствительными темами. Например, модель отказалась отвечать на вопросы о китайском лидере Си Цзиньпине, площади Тяньаньмэнь и геополитических последствиях возможного вторжения Китая на Тайвань.Изображение: DeepSeek
Подобное поведение, скорее всего, объясняется давлением со стороны китайских властей на проекты ИИ в стране. Все модели ИИ в Китае обязаны проходить проверку со стороны регулятора Интернета, чтобы их ответы соответствовали «основным социалистическим ценностям». Более того, сообщается, что правительство предложило создать список источников, запрещенных для обучения моделей. Это приводит к тому, что китайские ИИ часто избегают обсуждения тем, способных вызвать недовольство властей.Кто стоит за DeepSeek?
DeepSeek, которая планирует открыть исходный код DeepSeek-R1 и предоставить API, является довольно необычной компанией. Она финансируется китайским хедж-фондом High-Flyer Capital Management, использующим ИИ для информирования своих торговых стратегий.
Одна из ранних моделей компании, DeepSeek-V2, способная анализировать текст и изображения, вынудила конкурентов, таких как ByteDance, Baidu и Alibaba, снизить цены на использование своих моделей, а некоторые даже предложили их бесплатно.
Для обучения своих моделей High-Flyer строит собственные серверные кластеры. Последний из них включает 10 000 графических процессоров Nvidia A100 и обошелся компании в 1 миллиард юаней (~138 миллионов долларов).
Основатель High-Flyer, Лян Вэньфэн, выпускник факультета компьютерных наук, ставит перед собой цель достичь создания «сверхразумного» ИИ через проект DeepSeek.
Источник
Источник новости: habr.com