категории | RSS

Spotify тестирует ИИ-дубляж подкастов на иностранные языки голосами авторов

Spotify анонсировал функцию искусственного интеллекта для перевода голосов ведущих подкастов на разные языки. AI Voice Translation базируется на технологии компании OpenAI, которая ранее объявила о добавлении опций голосового чата в мобильные приложения ChatGPT. 

Spotify отмечает, что инструмент «использует последние инновации, одной из которых является недавно выпущенная технология генерации голоса OpenAI, чтобы соответствовать стилю оригинальной озвучки, обеспечивая более аутентичный опыт прослушивания».

Технологию протестировали такие известные подкастеры, как Дакс Шепард, Моника Пэдман, Лекс Фридман, Билл Симмонс и Стивен Бартлетт. Она позволила перевести отдельные эпизоды их подкастов на испанский, французский и немецкий языки.

Слушатели Spotify смогут получить доступ к переведённым подкастам в режиме «Сейчас исполняется». Также они будут доступны в специальном центре голосовых переводов.

Накануне OpenAI начала внедрять в чат-бота ChatGPT распознавание голоса. Для распознавания речи компания использует свою систему Whisper, код которой она открыла в прошлом году. Разработчики утверждают, что система распознаёт речь на английском языке как человек. Для обучения модели использовали 680 тысяч часов речевых данных. Whisper может корректно воспринимать произношение с акцентом, распознавать фоновые шумы, а также технические термины и жаргон.



Источник новости: habr.com

DimonVideo
2023-09-26T10:50:05Z

Здесь находятся
всего 0. За сутки здесь было 0 человек
Яндекс.Метрика