Google анонсировала закрытую предварительную версию Veo — модели генерации видео на базе искусственного интеллекта. Она позволяет создавать ролики с разрешением 1080p в широком диапазоне кинематографических и визуальных стилей.
Предварительная версия Veo стала доступной для клиентов Vertex AI. Теперь они могут генерировать видео, используя простые текстовые или графические подсказки.
Вместе с этим Google также объявила о выпуске в открытый доступ Imagen 3, своей последней модели преобразования текста в изображение. Компания утверждает, что Imagen 3 может генерировать изображения с высокой детализацией, которые являются фотореалистичными и содержат меньше отвлекающих визуальных артефактов по сравнению с Imagen 2. Модель будет доступна на следующей неделе на Vertex AI для клиентов Google Cloud.
Google также рассказала о новых функциях, которые позволят клиентам Imagen 3 изменять изображения, созданные с помощью ИИ:
редактирование с помощью текстовых подсказок, которое может затрагивать только части изображения, например, обновлять фон;
настройка управления моделью для создания изображений на основе определённых характеристик. Клиенты могут попросить Imagen 3 использовать собственный бренд, стиль, логотип, тему или характеристики продукта.
Google отмечает, что Veo и Imagen 3 поставляются с функциями безопасности. Обе модели предотвращают создание вредоносного контента и соответствуют принципам ответственного ИИ. Кроме того, невидимые водяные знаки SynthID встроены в каждое изображение и кадр, созданные Imagen 3 и Veo.
Генератор видео Veo впервые показали на Google I/O 2024 в мае этого года. В августе исследователи Google анонсировали модель машинного обучения Imagen 3, которая заменит собой прошлую версию и будет доступна в сервисе ImageFX. Она по умолчанию создаёт изображения с разрешением 1024×1024 пикселей. При этом есть возможность увеличить разрешение в 2, 4 и 8 раз.
Источник новости: habr.com