категории | RSS

OpenAI делает свой обновленный генератор изображений доступным для разработчиков

В среду компания OpenAI представила технологию, лежащую в основе новой и улучшенной функции генерации изображений в ChatGPT, в своем API, что позволяет разработчикам интегрировать ее в свои приложения и сервисы. Новый генератор изображений OpenAI,  запущенный для большинства пользователей ChatGPT в конце марта, стал вирусным благодаря своей способности создавать реалистичные фотографии в стиле Ghibli.

Это было неоднозначное благословение для OpenAI, приведшее к миллионам новых регистраций на ChatGPT, но также значительно напрягающее возможности компании. По данным компании, более 130 миллионов пользователей ChatGPT создали более 700 миллионов изображений всего за первую неделю доступности инструмента.

В API OpenAI возможность генерации изображений основана на модели AI под названием «gpt-image-1». Изначально мультимодальная модель gpt-image-1 может создавать изображения в разных стилях, следовать пользовательским инструкциям, использовать мировые знания и отображать текст.

Разработчики могут генерировать несколько изображений одновременно с помощью gpt-image-1 и контролировать качество генерации, а значит и скорость.

Согласно OpenAI, gpt-image-1 использует те же защитные ограждения, что и генерация изображений в ChatGPT, включая защитные меры, которые ограничивают модель от генерации контента, который противоречит политике компании. Разработчики могут контролировать чувствительность модерации, которая может быть установлена ​​на «авто» для стандартной фильтрации или на «низкую» для менее строгой фильтрации. Низкая фильтрация ограничивает меньше категорий потенциально несоответствующего возрасту контента, согласно документации OpenAI, предоставленной TechCrunch.

OpenAI также утверждает, что все изображения, созданные с помощью gpt-image-1, помечаются водяными знаками с метаданными C2PA, чтобы поддерживаемые платформы и приложения могли идентифицировать их как созданные с помощью AI.

Цена составляет 5 долларов за миллион входных токенов для текста, 10 долларов за миллион входных токенов для изображений и 40 долларов за миллион выходных токенов для изображений. (Токены — это необработанные биты данных, которые обрабатывает модель.) По данным OpenAI, это составляет около 2 центов, 7 центов и 19 центов за сгенерированное изображение для квадратных изображений низкого, среднего и высокого качества соответственно.

OpenAI утверждает, что такие компании, как Adobe, Airtable, Wix, Instacart, GoDaddy, Canva и Figma, уже используют или экспериментируют с gpt-image-1. Например, платформа Figma Design от Figma теперь позволяет пользователям генерировать и редактировать изображения через gpt-image-1, в то время как Instacart тестирует модель для изображений для рецептов и списков покупок.

Источник



Источник новости: habr.com

DimonVideo
2025-04-23T22:50:04Z

Здесь находятся
всего 0. За сутки здесь было 0 человек
Яндекс.Метрика