Как настроить голосовое распознавание сообщений в чат-ботах

Доступно на тарифе Pro и выше, а также на время бесплатного семидневного пробного периода

В SendPulse можно подключить к чат-ботам систему автоматического распознавания языка Whisper от OpenAI. Интеграция позволяет распознавать и транскрибировать голосовые сообщения подписчиков, что помогает удобно взаимодействовать с ботом с помощью голоса.

В статье рассмотрим принцип работы модели Whisper и ее настройки.

Что такое Whisper для OpenAI

Whisper – это система автоматического распознавания языка или ASR (Automated Speech Recognition), разработанная OpenAI. Технология ASR предназначена для преобразования разговорной речи в письменный текст.

Whisper различает все самые распространенные языки: английский, испанский, французский, немецкий, итальянский, португальский, голландский, русский, шведский, китайский, японский, корейский, арабский, украинский и другие. Модель можно использовать, например, для транскрибации или программ с голосовым управлением как голосовой ассистент и т.д.

Модель Whisper прежде всего сосредоточена на транскрибировании языка и превращении его в текст.

Как работает Whisper в чат-ботах SendPulse

Система Whisper доступна для интеграции чат-ботов с OpenAI, поэтому использует тот же токен что и ChatGPT и настраивается в том же модальном окне.

Читайте подробнее: Как подключить GPT к чат-боту.

Вы можете подключить ChatGPT и Whisper по отдельности или вместе.

Если включен только Whisper, в чате отображается распознанный текст.

Если включен Whisper и ChatGPT, при отправке голосового сообщения в бот оно будет распознано и отправлено в ChatGPT. Далее ChatGPT сгенерирует ответ и отправит подписчику в текстовой формате.

Если подписчик в голосовом сообщении использовал триггерное слово, будет запущена соответствующая цепочка.

Также если в цепочке чат-бота предусмотрен активный пользовательский ввод (ожидания текстовой строки), подписчик может записать и отправить голосовое сообщение, которое обработается в текст и запишется в соответсвующую переменную.

Как подключить Whisper к чат-ботам

Откройте необходимый чат-бот и перейдите на вкладку Настройки бота (Bot settings) > Интеграции (Integrations).

Вы можете подключить распознавание голосовых сообщений на этапе интеграции с OpenAI. Если она настроена, нажмите Подключено (Enabled) > Редактировать (Edit) напротив ChatGPT by OpenAI.

В модальном окне настроек активируйте переключатель Whisper Voice Recognition.

Если вы хотите, чтобы ChatGPT генерировал текстовые ответы, то активируйте тумблер ChatGPT: AI Text Response Generation. Если вы хотите использовать только распознавание голосовых сообщений, выключите этот тумблер.

Как просматривать голосовые сообщения

Перейдите в Диалоги (Conversation), аудиторию бота или виджет Чаты справа, чтобы просматривать все чаты с подписчиками.

Когда подписчик отправит в чат-бот голосовое сообщение, вы увидите транскрибацию его запроса внизу сообщения.

Если вы активировали опцию автоматического ответа ChatGPT: AI Text Response Generation в настройках интеграции, чат предоставит сгенерированный ответ.

OpenAI использует внутреннюю библиотеку информации – обрабатывает запрос клиента и выдает ответ на основе доступной информации. Также он не учитывает персональные данные подписчика.

    Оцените, насколько полезна статья "Как настроить голосовое распознавание сообщений в чат-ботах"

    Оценка: 5 / 5 (10)

    Далее

    Как добавить генерацию изображений в чат-боте с помощью инструментов OpenAI

    Популярное в нашем блоге

    Создайте собственный чат-бот