Последняя крупная языковая модель от OpenAI еще не была официально выпущена, но уже есть некоторые мнения о ее возможностях. Видеоролик о модели "o3" был представлен 20 декабря, и пока большая часть информации о ней остается внутри компании, только участники тестирования по безопасности получили ранний доступ.
Соучредитель OpenAI, Сэм Альтман, в видео отметил, что o3 является "невероятно умной моделью". По его словам, "мини" версия модели будет выпущена в конце января, а полная версия - позже.
Модель o3 была протестирована с помощью ARC-AGI, эталона, созданного для проверки способности AI к адаптации к новизне. На этом тесте модель достигла точности 76%, что превзошло средний результат человека. Создатель ARC-AGI, Франсуа Шолле, назвал это "удивительным расширением возможностей AI", требующим обновления интуиции о его способностях.
Несмотря на успех, Шолле подчеркивает, что o3 все еще не является AGI. Модель не может решить некоторые простые задачи, что отличает ее от человеческого интеллекта. Он также отмечает, что модель была обучена специально для теста ARC-AGI, и результаты могут измениться, если использовать нетренированную версию.
Шолле планирует выпустить обновленную версию ARC-AGI в январе, что, по его мнению, снизит результаты o3. Он считает, что AGI будет достигнуто, когда AI сможет решать задачи, которые просты для людей, но сложны для машин.
Источник
Источник новости: habr.com