Google в рамках презентации Gemini 2.0 рассказала о новой модели Gemini 2.0 Flash, которая превосходит Gemini 1.5 Pro по ключевым показателям и работает в два раза быстрее.
Помимо улучшенной производительности и низкой задержки, Gemini 2.0 Flash также имеет встроенную поддержку мультимодального вывода, включая сгенерированные изображения, смешанные с текстом, и управляемый многоязычный аудиосигнал с преобразованием текста в речь (TTS).
Модель поддерживает мультимодальные входные данные, такие как изображения, видео и аудио.
Она может вызывать для работы дополнительные инструменты, включая Google Search, выполнения кода и другие.
Сравнение производительности Gemini 2.0 Flash и предшественников:
Разработчики могут опробовать экспериментальную версию модели Gemini 2.0 Flash в AI Studio и Vertex AI. Также им стал доступен новый API Multimodal Live, который поддерживает аудио в реальном времени, потоковый видеовход и возможность использовать несколько комбинированных инструментов.
Gemini 2.0 Flash также появится в пользовательском приложении чат-бота Gemini в январе 2025 года.
Вместе с Gemini 2.0 Flash Google также анонсировала несколько разработок, которые исследуют агентные возможности Gemini 2.0. Так, в Project Astra внедрили возможность общаться на нескольких языках и на смешанном языке. Модель запоминает до 10 минут сеанса и может использовать Google Search, Lens и Maps.
Project Mariner — ещё один агент ИИ, который может понимать и интерпретировать информацию на экране при работе в браузере. Google утверждает, что эффективность работы модели достигла 83,5%.
Jules — это агент для создания кода на базе ИИ, который интегрируется непосредственно в рабочий процесс GitHub. Он может самостоятельно решать проблемы, разрабатывать план и выполнять его, но под руководством и контролем разработчика.
Также Google представила новый инструмент искусственного интеллекта под названием Deep Research, который позволяет вызвать чат-бота Gemini для поиска в Интернете нужных данных и составления подробных отчётов.
Источник новости: habr.com