Корпоративным компаниям стоит обратить внимание на Deep Research от OpenAI. Это мощный продукт, основанный на новых возможностях, и настолько хорош, что может оставить многих людей без работы. Deep Research находится на острие растущего тренда: интеграции больших языковых моделей (LLM) с поисковыми системами и другими инструментами для значительного расширения их возможностей. Например, когда готовилась эта статья, xAI Илона Маска представила Grok 3, который претендует на аналогичные возможности, включая продукт Deep Search. Однако пока слишком рано оценивать производительность Grok 3 в реальных условиях, так как большинство подписчиков еще не смогли опробовать его.
Deep Research от OpenAI, выпущенный 3 февраля, требует Pro-аккаунт стоимостью $200 в месяц и в настоящее время доступен только пользователям в США. Это ограничение, возможно, затруднило раннюю обратную связь от глобального сообщества разработчиков, которые обычно быстро разбирают новейшие достижения в области AI.
В режиме Deep Research пользователи могут задать любой вопрос ведущей модели o3 от OpenAI. Результат? Отчет, который зачастую превосходит по качеству работу человеческих аналитиков, при этом создается быстрее и стоит значительно дешевле. Хотя Deep Research активно обсуждается, его более широкие последствия еще не полностью осознаны. Первые отзывы восхваляют его впечатляющие возможности проведения исследований, несмотря на периодические «галлюцинации» в ссылках. Один из пользователей рассказал, что использовал этот инструмент, чтобы помочь своей жене, которая болела раком груди. По его словам, Deep Research предоставил более глубокий анализ, чем лечащие врачи, относительно выбора лучшей терапии — лучевой.
Консенсус, подытоженный профессором AI Вартонской школы Этаном Молликом, заключается в том, что преимущества этой модели значительно перевешивают случайные ошибки, так как проверка фактов занимает меньше времени, чем та экономия, которую обеспечивает AI в целом. Это подтверждают мои личные наблюдения за неделю использования. Финансовые учреждения уже исследуют его применение. Например, BNY, один из 12 крупнейших банков США, видит потенциал использования Deep Research для оценки кредитных рисков. Его влияние будет распространяться на разные отрасли — от здравоохранения до ритейла, производства и управления цепочками поставок, то есть практически на любую область, зависящую от интеллектуальной работы.
В отличие от традиционных AI-моделей, которые стремятся дать одноразовый ответ, Deep Research сначала задает уточняющие вопросы. Это может быть 4 и более вопросов, чтобы убедиться, что модель точно поняла запрос. Затем она разрабатывает структурированный план исследования, выполняет несколько поисков, корректирует план на основе новых данных и повторяет процесс, пока не соберет полный, хорошо оформленный отчет. Это может занять от нескольких минут до получаса. Отчеты варьируются от 1500 до 20 000 слов и обычно содержат ссылки на 15–30 источников с точными URL.
Deep Research достигает этого, объединяя две технологии так, как мы раньше не видели в массовом продукте. Первая технология — это новейшая модель OpenAI o3, лидирующая в логических рассуждениях и цепочках размышлений. Когда она была анонсирована в декабре 2024 года, o3 набрала беспрецедентные 87,5% на сверхсложном тесте ARC-AGI, разработанном для проверки способностей к новаторскому решению проблем. Интересно, что o3 пока не выпущена как самостоятельная модель для разработчиков. Более того, генеральный директор OpenAI Сэм Альтман на прошлой неделе объявил, что модель будет частью «унифицированной системы интеллекта», объединяющей модели с инструментами, такими как поиск, агенты кодирования и многое другое. Deep Research — это пример такого продукта. И хотя конкуренты, такие как DeepSeek-R1, приблизились к возможностям o3, OpenAI все еще считается лидером. Вторая технология — агентная RAG, которая существует около года. Она использует агентов для автономного поиска информации и контекста из других источников, включая интернет.
Это может включать вызов других агентов для поиска информации через API, агентов-кодировщиков, способных выполнять сложные последовательности, и поиск в базах данных. Первоначально Deep Research от OpenAI в основном ищет в открытом интернете, но руководители компании намекнули, что со временем модель сможет обращаться к большему количеству источников.
Хотя эти технологии не новы, усовершенствования OpenAI вывели Deep Research на новый уровень. Модель работает в закрытом режиме и использует обратную связь от более чем 300 миллионов активных пользователей популярного продукта ChatGPT. OpenAI лидирует в исследованиях этих технологий, например, в том, как пошагово проверять информацию для получения лучших результатов. Deep Research также использует поиск интересным образом, возможно, заимствуя технологии Microsoft Bing.
Хотя модель все еще генерирует «галлюцинации», она делает это реже, чем конкуренты, возможно, отчасти потому, что базовая модель o3 установила отраслевой минимум для этих ошибок — всего 8%. Существуют способы еще больше уменьшить ошибки, используя такие механизмы, как порог доверия, требования к цитированию и другие сложные проверки достоверности.
Однако существуют и ограничения возможностей OpenAI. Через два дня после запуска Deep Research компания HuggingFace представила открытого агента для исследований под названием Open Deep Research, который показал результаты, близкие к результатам OpenAI. Это подчеркивает, что серьезных барьеров между конкурентами мало. Открытые конкуренты, такие как DeepSeek, остаются близкими в области моделей рассуждений, а Microsoft предлагает рамки для агентных возможностей, подобных OpenAI.Ценность Deep Research сначала растет по мере того, как онлайн-информация становится более скудной, а затем падает, когда информации становится совсем мало. Источник: Stratechery.
Кроме того, у Deep Research есть ограничения. Продукт действительно эффективен в исследовании редкой информации, доступной в сети. Но в тех областях, где информации мало, а экспертиза в основном частная — например, в головах специалистов или в закрытых базах данных — продукт не работает. Так что высококвалифицированные исследователи, работающие в хедж-фондах, чья задача — общаться с экспертами, не пострадают. В большинстве случаев Deep Research будет угрожать рабочим местам аналитиков более низкого уровня.
Когда объединяются топовые рассуждения с агентным извлечением, неудивительно, что получается столь мощный продукт. Deep Research от OpenAI достиг 26,6% на тесте «Последний экзамен человечества», одном из самых сложных тестов для AI, охватывающем 3000 вопросов по 100 различным темам.
Источник
Источник новости: habr.com