«Сбер» выпустил приложение SaluteSpeech App для распознавания и озвучивания текста, построенное на базе одноимённой платформы. Доступны сборки для Windows и macOS.
В официальной документации платформы SaluteSpeech появилась страница с информацией о фирменном приложении. Оно пока находится в бете, но пользователи уже могут скачать его. Для доступа к приложению необходимо получить токены SaluteSpeech API и GigaChat API.
Приложение бесплатное и доступно для Windows и macOS, но для полноценной работы потребуется оплатить тариф SaluteSpeech. Его минимальная цена составляет 600 рублей в месяц, но есть бесплатный тариф для физических лиц. С ним можно распознавать 100 минут аудио и синтезировать в речь 200 тыс. символов в месяц.
Для распознавания принимаются аудиозаписи в форматах PCM, OPUS, MP3, FLAC, ALAW и MULAW. На выходе пользователь получает текст, который можно озвучить в разделе «Синтез». Поддерживается русский и английский языки и несколько голосов на выбор. Готовый файл озвучки доступен в формате WAV.
Источник новости: habr.com