Google обновила чат-бота Bard. Он получил поддержку большой языковой модели Gemini Pro, а также модели Imagen 2 для генерации изображений.
Gemini Pro добавили в Bard для англоязычных пользователей ещё в декабре, но теперь модель доступна более чем на 40 дополнительных языках в 230 странах и территориях. Google также расширил функцию двойной проверки до 40 языков, что позволяет пользователям сверять ответы путем автоматического поиска в Интернете подтверждения или опровержений утверждений чат-бота.
Кроме того, Bard теперь также может генерировать изображения по текстовым описаниям более чем на 40 языках. Чат-бот получил поддержку модели Imagen 2. Её обучали на более качественных парах изображений и описаний, чтобы модель могла генерировать более детализированные картинки, которые лучше соответствуют семантике языковых подсказок. В Bard Imagen 2 доступна бесплатно в отличие от ChatGPT Plus, где требуется платная подписка для генерации фотореалистичных изображений в различных стилях.
В Google заявили, что возможности Bard по созданию изображений были «разработаны с учётом ответственности». Функция водяных знаков SynthID компании будет встроена в пиксели картинок, позволяя доказать их происхождение. Google внедрила иные меры безопасности, чтобы избежать создания изображений известных людей и ограничить генерацию жестокого, оскорбительного или сексуализированного контента.
Компания также выпустила экспериментальный инструмент для работы с фотографиями на базе Imagen 2 под названием ImageFX. Он позволяет пользователям создавать изображения с помощью простых текстовых подсказок, а отзывы о работе будут направляться непосредственно инженерам Google. Как и в случае с Bard, все фотографии, созданные с помощью ImageFX, будут помечены SynthID и должны соответствовать принципам безопасного ИИ.
В конце 2023 года Google представила модель Imagen 2, которая генерировать более реалистичные изображения, используя естественное распределение обучающих данных вместо заранее запрограммированного стиля. Она отличается улучшенным пониманием контекста, обеспечивает рендеринг реалистичных рук и человеческих лиц, а также может расширять исходную картинку.
В январе разработчики сообщили, что в чат-бота Bard добавят функцию генерации изображений.
Источник новости: habr.com