В конце 2024 года отрасль искусственного интеллекта пережила критический момент, когда возникли опасения, что развитие более умных AI замедляется. Однако модель o3, представленная OpenAI, вызвала новый ажиотаж и споры, предполагая, что в 2025 году могут произойти более значительные улучшения.
Модель o3, пока доступная только для тестирования на безопасность среди исследователей, но ещё не выпущенная в открытый доступ, достигла впечатляющих результатов в тесте ARC, разработанном Франсуа Шолле, известным исследователем AI. Этот тест оценивает способность модели решать новые интеллектуальные задачи. o3 значительно превзошла предыдущие результаты, набрав 75,7% стандартным способом и 87,5% при использовании мощных вычислительных ресурсов, в отличие от 53%, показанных Claude 3.5.
Шолле отметил, что успех o3 удивителен, учитывая его прежнюю критику в адрес способности больших языковых моделей (LLM) достигать такого уровня интеллекта. Это подчеркивает важность инноваций для ускорения прогресса в области искусственного общего интеллекта (AGI), стремящегося к созданию интеллекта, способного адаптироваться к новым задачам лучше, чем люди.
Модель o3 решает проблемы с логическим мышлением и адаптивностью, которые долго мешали развитию LLM, но также выявляет такие проблемы, как высокие затраты на вычисления. Мы воспользуемся идеями лидеров отрасли, заявлениями OpenAI, и, прежде всего, важным анализом Шолле, чтобы понять, что этот прорыв означает для будущего AI в 2025 году. 5 основных инновация о31. “Синтез программы” для адаптации задачи
Новая функция позволяет динамически комбинировать то, что модель изучила во время предварительного обучения, т.е. конкретные шаблоны, алгоритмы и методы — в новые конфигурации. Эти элементы могут включать математические операции, фрагменты кода или логические процедуры, с которыми модель столкнулась и обобщила во время обширного обучения на различных наборах данных. Самое главное, что синтез программ позволяет o3 решать задачи, с которыми он никогда напрямую не сталкивался при обучении.2. Поиск программы на естественном языке
В основе адаптивности o3 лежит использование цепочек рассуждений (CoT) и сложного процесса поиска, который происходит во время логического вывода — когда модель активно генерирует ответы в реальных условиях. Эти цепочки рассуждений представляют собой пошаговые инструкции на естественном языке, которые модель генерирует для поиска решений. 3. Модель оценщика: новый вид рассуждений
о3 активно генерирует несколько вариантов решения во время логического вывода, оценивая каждый из них с помощью интегрированной модели-оценщика, чтобы определить наиболее перспективный вариант. 4. Выполнение собственных программ
Одной из самых революционных особенностей o3 является его способность использовать собственные цепочки рассуждений (CoT) в качестве инструментов для адаптивного решения задач. o3 от OpenAI использует CoT в качестве многократно используемых строительных блоков, что позволяет модели решать новые задачи с большей адаптивностью. Со временем эти CoT становятся структурированными записями стратегий решения задач, подобно тому, как люди документируют и совершенствуют свои знания на основе опыта. 5. Поиск программ с руководством по глубокому обучению
о3 использует подход, основанный на глубоком обучении, во время логического вывода для оценки и уточнения потенциальных решений сложных задач. Этот процесс включает в себя создание нескольких вариантов решения и использование шаблонов, изученных во время обучения, для оценки их жизнеспособности.
Однако модель требует значительных вычислительных ресурсов, что вызывает экономические опасения. Выпуск o3 привлек внимание сообщества AI, мнения разделились: одни хвалят её достижения, другие критикуют за высокую стоимость и непрозрачность.
Для бизнеса o3 открывает новые возможности, но высокие затраты могут стать препятствием. OpenAI планирует выпустить o3-mini, более доступную версию модели.
Корпоративные компании смогут протестировать модель в начале следующего года, что позволит оценить её на собственных данных. В то же время они могут использовать существующие проверенные модели.
Таким образом, в следующем году компании сосредоточатся на практическом применении AI и наблюдении за развитием технологий, извлекая выгоду из текущих инноваций.
Источник
Источник новости: habr.com