Google анонсировала Imagen 3 — нейросеть для генерации изображений по текстовому описанию

Разное

14:50 19-08-2024

DimonVideo

Google анонсировала Imagen 3 — нейросеть для генерации изображений по текстовому описанию

На портале arXive команда исследователей Google анонсировала модель машинного обучения Imagen 3, предназначенную для генерации изображений по текстовому описанию. Она заменит собой прошлую версию и будет доступна в сервисе ImageFX.

Нейросеть Imagen 3 по умолчанию создаёт изображения с разрешением 1024×1024 пикселей. При этом есть возможность увеличить разрешение в 2, 4 и 8 раз. В компании считают, что Imagen 3 лучше других моделей на рынке справляется с созданием фотореалистичных картинок и может обрабатывать длинные запросы с обилием деталей.Изображения в разрешении 4K (12 МП), созданные с помощью Imagen 3

Для датасета использовали уникальные изображения, которые прошли через несколько фильтров. В первую очередь из набора данных убрали небезопасные и жестокие картинки, а после удалили низкокачественные файлы. Кроме того, инженеры внимательно следили, чтобы в датасет не попали сгенерированные изображения. К каждой картинке добавили текстовое описание.Примеры работ Imagen 3

В ближайшее время Imagen 3 появится на платформе ImageFX от Google. Доступ к самой платформе пока есть только у жителей США. Всем остальным пользователям необходимо зарегистрироваться в очереди и ждать, когда компания расширит географию сервиса.

Источник новости: habr.com

Чат в Telegram

Регистрация

Войти

Главная

Опросы

Форум

Обзор новинок

Обменник

Android

Трекер

PC

Видео

Картинки

Новости

Разные новости

Статьи

Блоги

Комментарии

ПОДДЕРЖИ сайт

Google анонсировала Imagen 3 — нейросеть для генерации изображений по текстовому описанию

Разное

Похожие файлы

Ученые ускорили работу нейросетей для генерации изображений

Разработчики анонсировали SynCity — нейросеть для генерации 3D-миров в стиле градостроительных симуляторов

Stability AI выпустила модель Stable Cascade для генерации изображений

Исследователи Meta* выпустили VFusion3D — нейросеть для генерации 3D-моделей по фотографии