категории | RSS

OpenAI представляет рекомендации по эффективному использованию моделей серии O: акцент на прямом обучении

OpenAI опубликовала рекомендации по эффективному использованию своих моделей серии O, сделав акцент на прямом обучении, а не на сложных методах подсказок. Модели серии o, которые OpenAI называет «планировщиками», специализируются на задачах, связанных с математикой, инженерией, юриспруденцией и финансами. Модели GPT служат «рабочими лошадками» для быстрых, базовых задач. «Одно семейство моделей не лучше другого — они просто разные», — пишет OpenAI.

Для проектов, требующих многоэтапного выполнения, компания предлагает использовать o-модели для создания подробных планов, а модели GPT будут заниматься выполнением отдельных задач. Предстоящий GPT-5 нацелен на объединение обоих подходов , гибридный подход, аналогичный тому, что, как сообщается, разрабатывает Anthropic.

Для o-серии OpenAI предлагает более простой подход к подсказкам. Компания предостерегает от того, что она называет «подсказками бумеров» — термин, который создал путаницу в сообществе. OpenAI может ссылаться либо на чрезмерно подробные подсказки, либо на устаревшие методы подсказок.

«В целом, модели рассуждений дают лучшие результаты при выполнении задач, имея только высокоуровневые инструкции. Это несколько отличается от моделей GPT, которые часто выигрывают от очень точных инструкций», — пишет OpenAI.

OpenAI предлагает делать инструкции краткими и понятными, используя XML-теги для организации более длинных подсказок. Пользователи должны специально избегать фразы   «думай шаг за шагом» с o-моделями , поскольку модели рассуждений уже имеют «заложенные» подсказки цепочки мыслей — они обучены на цепочках мыслей.

Вот что OpenAI считает хорошей научной подсказкой: Какие три соединения нам следует рассмотреть для изучения с целью продвижения исследований новых антибиотиков? Почему нам следует их рассмотреть?

OpenAI также рекомендует начинать без примеров (Zero Shot Prompt) и добавлять их по мере необходимости (Few or Many Shot Prompt). Пользователи должны определить четкие критерии успеха и «поощрять модель продолжать рассуждать и итерировать», пока она не будет им соответствовать. Также включите конкретные ограничения, такие как бюджетные ограничения («предложить решение с бюджетом менее 500 долларов»).

Согласно OpenAI, o-модели могут обрабатывать неполную или противоречивую информацию, точно интерпретируя намерения пользователя, даже из частичных инструкций. Они особенно хороши в выявлении релевантной информации в больших объемах неструктурированных данных и распознавании шаблонов в сложных документах, таких как контракты, финансовые отчеты и страховые претензии.

Источник



Источник новости: habr.com

DimonVideo
2025-02-15T06:50:03Z

Здесь находятся
всего 0. За сутки здесь было 0 человек
Яндекс.Метрика