Компания Google сделала неожиданный шаг в гонке генеративного ИИ, представив экспериментальную мультимодальную версию Gemini 2.0 Flash в AI Studio. Теперь модель не только генерирует изображения «с нуля», но и позволяет менять детали на существующих снимках через обычный чат — без необходимости пересоздавать картинку заново. Это первый случай, когда крупный игрок рынка внедряет такой функционал, опередив OpenAI и Илонa Маска с его xAI.
Пользователи могут в режиме диалога давать Gemini команды вроде «замени фон на горный пейзаж» или «добавь надпись на русском языке». Нейросеть сохраняет контекст беседы, что позволяет вносить серию правок постепенно. Например, сначала изменить одежду человека на фото, затем «перенести» его в другую локацию, а после — настроить освещение. Все изменения применяются к исходному изображению, что экономит время и ресурсы.Каждое сгенерированное изображение автоматически помечается водяным знаком SynthID — технология Google для борьбы с глубокими фейками. Это особенно важно для дизайнеров и маркетологов, которые смогут легально использовать контент в коммерческих проектах. Среди неочевидных функций — клонирование текстур объектов, колоризация старых фото и даже «дорисовка» недостающих элементов на снимках с помощью текстовых подсказок.Хотя Gemini 2.0 Flash понимает запросы на русском, официально сервис недоступен в России. Разработчики и компании могут тестировать модель бесплатно через AI Studio или API, но некоторые функции пока работают нестабильно — например, замена лиц или сложная реставрация. В Google подчеркивают, что это ранняя версия, а финальный релиз будет оптимизирован для задач реального времени.Эксперты отмечают, что Google впервые объединила в одной модели креативность Midjourney, точность DALL-E и интерактивность ChatGPT. Если эксперимент окажется успешным, это кратно упростит работу в дизайне, образовании и даже журналистике — например, мгновенная визуализация данных или создание иллюстраций для статей без участия человека. Пока же Gemini 2.0 Flash остаётся любопытным инструментом, который, однако, уже сегодня заставляет пересмотреть представление о возможностях генеративного ИИ.Источник новости: vgtimes.ru