«Сбер» представил сервис речевых технологий для бизнеса SmartSpeech

«Сбер» запустил сервис голосовых технологий для бизнеса SmartSpeech. С его помощью компании смогут подключить речевые технологии в голосовом меню, автоответчике, чатах, телемаркетинге и т.д. без использования специального оборудования. На основе SmartSpeech уже работает семейство виртуальных ассистентов «Сбера» «Салют».

SmartSpeech самостоятельно распознает и синтезирует речь и может использовать «подсказки», чтобы лучше понять потребности пользователя в зависимости от контекста. Отдельно записывать речь для сервиса не требуется — нужно загрузить текст в систему и выбрать подходящий тон, тембр и настроение озвучки из библиотеки голосов. После этого робот сам прочитает текст вслух.

«Речевые технологии, лежащие в основе сервиса SmartSpeech, сейчас активно внедряются в кол-центрах и службах поддержки, а их использование стоит в разы меньше, чем работа оператора или диктора. Например, многие компании автоматизируют работу со звонками, записывая готовые реплики, но работу, которую сейчас выполняет человек, можно отдать сервису, функционирующему на основе речевых технологий. Таким же образом компании могут озвучивать тексты сайтов и приложений или добавить опцию голосового ввода, что значительно ускоряет взаимодействие пользователя с ресурсом и дает ему возможность пользоваться тем или иным сервисом даже за рулем».

— Денис Филиппов, CTO SberDevices

Одной из главных особенностей SmartSpeech в «Сбере» называют модель распознавания тишины и шума и способность определять конец высказывания и эмоции собеседника. Эти возможности помогают системе лучше понимать человеческую речь и давать более качественный ответ.

Как это работает

SmartSpeech работает с использованием нейросетей, которые обучаются на огромных объемах данных с использованием мощностей суперкомпьютера «Кристофари» от «Сбера». В распознавании речи используются сверхточные архитектуры Jasper, QuartzNet и другие.

Для достижения более качественного синтеза речи команда SberDevices модифицировала архитектуру синтезатора речи от Google Tacotron 2, внедрив в нее контроль за частотой основного тона речи и паузами, а также изменяя интонацию в зависимости от темы текста.

До конца года доступ к SmartSpeech будет бесплатным. Протестировать сервис можно с помощью API, доступ к которому предоставляется по запросу. Чтобы упростить интеграцию, API использует протоколы HTTP и gRPC.

Запуском SmartSpeech «Сбер» продолжает развивать линейку интерактивных сервисов для бизнеса. В конце апреля компания «Сбер» открыла доступ к бета-версии платформы для создания виртуальных персонажей Visper, разработанной SberDevices. Сервис в полуавтоматическом режиме преобразовывает презентации (в том числе в PDF) в видео с визуальными персонажами.


Все интересное про диджитал у нас в телеграме, а может быть и у вас: https://t.me/performance_360

Другие хорошие статьи