OpenAI представляет исследовательскую версию GPT-4.5 — самой масштабной и многофункциональной языковой модели компании на сегодняшний день. Эта разработка продолжает линейку моделей, начатую GPT-4o, но делает акцент на универсальности, расширяя возможности за пределы узкоспециализированных STEM-задач. GPT-4.5 обучалась с использованием новых методов надзора, включая supervised fine-tuning (SFT) и обучение с подкреплением на основе обратной связи от людей (RLHF), что позволило улучшить её способность понимать контекст, эмоции и намерения пользователей.
Перед выпуском модель прошла масштабные тесты на безопасность, показав, что риски, связанные с генерацией вредоносного контента или нарушением этических норм, не превышают показатели предыдущих версий. Ранние испытания демонстрируют, что взаимодействие с GPT-4.5 ощущается как более естественное: модель реже допускает галлюцинации, лучше справляется с творческими задачами (например, написанием текстов или дизайном) и демонстрирует повышенный уровень эмоционального интеллекта, адаптируясь к запросам пользователя — будь то совет, поддержка или решение бытовых проблем.
P.S. GPT-4.5 выпущена в статусе исследовательской превью, чтобы изучить её потенциал и ограничения. Данные были взяты из официальной документации OpenAI.ЧТО НОВОГО В GPT 4.5?
Ключевым преимуществом GPT-4.5 стало резкое снижение галлюцинаций — ошибочных или вымышленных утверждений. В тестах PersonQA, где проверялась точность ответов на вопросы о людях, модель показала 78% правильных результатов против 28% у GPT-4o, а уровень галлюцинаций сократился до 19% . Это делает её надёжным инструментом для задач, требующих фактической точности, будь то научные исследования или помощь в обучении.
Ещё одно важное улучшение — эмоциональный интеллект. GPT-4.5 анализирует контекст и эмоциональную окраску запросов, предлагая персонализированные ответы: от дружеской поддержки до профессиональных советов. Например, модель распознаёт разницу между просьбой «написать стихотворение» и «помочь с решением конфликта», адаптируя тон и содержание. Внутренние тесты OpenAI подтвердили, что взаимодействие с GPT-4.5 ощущается как более естественное и «тёплое», что особенно ценно в сценариях, где важны эмпатия и доверие.ЧТО ПО БЕЗОПАСНОСТИ?
Модель GPT-4.5 демонстрирует значительный прогресс в защите от вредоносных запросов, сохраняя баланс между доступностью и безопасностью. Одним из ключевых улучшений стала устойчивость к jailbreak-атакам — попыткам обхода защиты через сложные формулировки запросов. В тестах StrongReject , где оценивается сопротивление модели к 10% самых эффективных атак из академических исследований, GPT-4.5 показал показатель goodness@0.1 = 0.34 , что сопоставимо с GPT-4o (0.37) и существенно выше результатов предыдущих версий. Это достигнуто за счет усовершенствованных методов выравнивания (alignment), включая обучение на данных, сгенерированных менее масштабными моделями, что усилило понимание контекста и намерений пользователей.
Важным нововведением стала иерархия инструкций — система приоритетов, где команды из системных сообщений (например, запреты на обсуждение конфиденциальной информации) всегда доминируют над пользовательскими запросами. В тестах на противоречивые сообщения GPT-4.5 верно выполнял системные инструкции в 76% случаев (против 68% у GPT-4o), а в сценариях «репетитора по математике», где пользователь пытался выведать ответ, модель отказывала в 77% попыток (против 33% у GPT-4o). Это снижает риски утечек данных и выполнения небезопасных действий, таких как раскрытие паролей или доступ к защищённым системам.
Риски CBRN (химические, биологические, радиологические и ядерные угрозы) были минимизированы за счет многоуровневых мер:
Фильтрация данных на этапе обучения, исключающая информацию о создании оружия с ограниченным легальным применением.
Система отказов при запросах, связанных с синтезом опасных веществ. Например, в тестах на этапах планирования биологических угроз (Ideation, Acquisition) GPT-4.5 после митигации показал 0% срабатываний , полностью блокируя подобные запросы.
Поддержка легитимных исследований : модель помогает экспертам в анализе научных данных, но только при наличии подтверждённой экспертизы пользователя.
Кроме того, GPT-4.5 улучшил защиту от киберугроз. В тестах на решение CTF-задач модель справляется с 53% школьных заданий CFT (например, эксплуатация уязвимостей веб-приложений или криптография), но демонстрирует низкие риски в профессиональных сценариях (2% успеха ), что подтверждает её безопасность для реальных систем.ОЦЕНКА METR
METR (независимая исследовательская группа) получил доступ к ранней версии GPT-4.5 для оценки её возможностей.
В рамках эксперимента:
Методология :
Проверялась эффективность модели в автономных агентах, используя среду, оптимизированную для OpenAI o1.
Оценивались задачи, связанные с разработкой ИИ и исследованиями (например, выполнение кода, анализ данных).
Результаты :
GPT-4.5 показал результаты на уровне между GPT-4o и o1.
Важный показатель — «временной горизонт» (сколько времени агент справляется с задачей на 50% надежности). Для GPT-4.5 он составил 30 минут , что указывает на её способность решать краткосрочные задачи, но не долгосрочные проекты.
Ограничения :
Оценки METR основаны на ограниченном доступе к модели (7 дней), а детальный анализ будет опубликован позже.
Третьи стороны пока не могут полностью проверить потенциал GPT-4.5 из-за отсутствия данных о её обучении и тонких настроек.
Итог : METR подтвердил, что GPT-4.5 — это шаг вперёд в сравнении с GPT-4o, но до уровня o1 или deep research ей далеко. Модель подходит для задач, требующих умеренной автономности, но не для сложных сценариев вроде самостоятельного научного исследования.
На момент написания этой новости конференция ещё не прошла, а я уже поделился инсайтами о новой модели. Если хочешь быть в числе первых, кто узнает о технологических трендах, то приглашаю в свой канал "Охота за технологиями". Здесь я пишу о бизнесе и технологиях, которые покоряют сердца миллионов. И, кстати, делюсь уникальными фишками по ИИ, которые не найдешь больше нигде! Это не спам, и не реклама ради рекламы — я просто хочу, чтобы люди, которым это действительно интересно, получали самую свежую и правильную информацию.
Источник новости: habr.com