категории | RSS

Google добавляет свою голосовую модель Chirp 3 к своей платформе Vertex AI

Большая часть внимания в генеративном AI была сосредоточена на текстовых интерфейсах, используемых для генерации текста, изображений и многого другого. Следующая волна, похоже, будет голосом, и она быстро накатывает. В последней разработке Google сегодня объявила, что добавит Chirp 3 — свои модели преобразования речи в текст и HD-текста в речь — в свою платформу разработки Vertex AI, начиная со следующей недели.

На прошлой неделе Google тихо объявила, что Chirp 3 выпустит восемь новых голосов для 31 языка. Варианты использования платформы включают создание голосовых помощников, создание аудиокниг и разработку агентов поддержки и озвучки для видео. Новость была объявлена ​​на мероприятии в офисах DeepMind компании Google в Лондоне.

Его усилия предпринимаются в то же время, когда другие делают рывок вперед в своей работе над голосовым AI. На прошлой неделе Sesame — стартап, стоящий за вирусными, очень реалистично звучащими приложениями AI «Maya» и «Miles», — объявил о запуске своей модели для разработчиков, чтобы создавать собственные настраиваемые приложения и сервисы поверх его технологий. В частности, будут введены ограничения на использование Chirp 3, чтобы попытаться контролировать неправильное использование.

«Мы просто работаем над некоторыми из этих вещей с нашей командой по безопасности», — сказал Томас Куриан, генеральный директор Google Cloud.

ElevenLabs — один из крупнейших стартапов, который привлек сотни миллионов долларов финансирования для расширения своей деятельности в сфере голосовых сервисов на базе искусственного интеллекта.

Эта новость поставит Chirp 3 в один ряд с новыми версиями флагманского LLM Gemini, которые сейчас проходят тестирование, а также с его моделью генерации изображений Imagen и дорогим инструментом генерации видео  Veo 2. Остается подтвердить, будет ли то, что Google выпускает с Chirp 3, таким же «реалистичным», как некоторые другие попытки AI создать «человеческие» голоса (работа Sesame выделяется в особенности). Но как подчеркнул Демис Хассабис, генеральный директор DeepMind, это остается марафоном, а не спринтом. «В ближайшей перспективе эта идея, что AI является серебряной пулей для всего в ближайшие пару лет, я пока не вижу, что это произойдет. Думаю, нам еще несколько лет до того, как произойдет что-то вроде AGI», — сказал он.

«Это изменит все в течение следующего десятилетия, то есть в среднесрочной и долгосрочной перспективе. Это один из тех интересных моментов во времени».

Google запустил Vertex AI еще в 2021 году как платформу для разработчиков, позволяющую создавать сервисы машинного обучения в облаке. Это было, конечно, задолго до взрыва интереса к AI, и в частности к генеративному AI, который произошел с запуском сервисов GPT OpenAI. 

С тех пор компания частично склоняется к Vertex AI, поскольку она догоняет другие компании, такие как Microsoft и Amazon — они также создают генеративный инструментарий AI для разработчиков. Помимо создания генеративного AI поверх Gemini, разработчики могут использовать Vertex AI для классификации данных, обучения моделей и настройки моделей для производства. Будет интересно, расширит ли она свой огороженный сад на модели, выходящие за рамки тех, что созданы самой Google.

Компания Google уже много лет занимается разработкой голосовых сервисов «Chirp», начиная с использования этого названия в качестве кодового имени в своих ранних попытках конкурировать с сервисом Alexa от Amazon. 

Источник



Источник новости: habr.com

DimonVideo
2025-03-17T22:50:05Z

Здесь находятся
всего 0. За сутки здесь было 0 человек
Яндекс.Метрика