Synthèse et reconnaissance de la parole

(TTS - Text To Speech)

Selon l'utilisation, la synthèse de la parole peut être générée en direct (live feed - à la volée pendant la communication) ou par des messages présynthétisés.

Pour la synthèse vocale en direct, nativIP serveur supporte le protocole MRCP (Media Resource Control Protocol) permettant l'utilisation des principales solutions de synthèse de la parole du marché (Acapela, Nuance Speech Suite / Nuance Vocalizer ...)

La présynthèse - accessible notamment par l'éditeur de scénario et de nombreux modules annexes - utilise le protocole SAPI (SAPI 4 ou SAPI 5) permettant l'utilisation des voix systèmes de Windows Server 2012R2/2016/2019/2022.

Ainsi, selon les besoins, la solution la moins impactante financièrement et techniquement est disponible.

Reconnaissance de la parole (ASR - Automatic Speech Recognition)

Comme pour la synthèse de la parole, nativIP serveur supporte le protocole standard MRCP pour accéder aux principales solutions du marché vous permettant de choisir librement la solution la plus adaptée à vos besoins.

Qu'il s'agisse de réaliser un serveur vocal interactif (SVI) orientant les appelants vers le poste ou le service souhaité (standard auto virtuel) ou de consulter/interagir avec des données/équipements par des menus vocaux, toutes les utilisations sont possibles.

 

  • Grammaires SRGS GrXML ou ABNF selon le serveur de reconnaissance de la parole utilisé.
  • Nombre de grammaires non limité, plusieurs grammaires par scénario (chaque menu peut charger sa propre grammaire).
  • Sans apprentissage, Reconnaissance multi-locuteurs, Multilingue.
  • Interprétation sémantique (SML).
  • Gestion dynamique des accès au serveur de reconnaissance pour optimisation des licences.
  • Scripting ouvert de traitement des réponses (PHP, Perl, JavaScript...), code accessible / modifiable par le client.
  • Menus hybrides (voix/DTMF) permettant des dialogues clavier/voix dans un scénario unique et unifié.


Intégration ouverte

La synthèse de la parole ainsi que la reconnaissance de la parole sont directement accessibles aux  scripts via les scénarios vocaux.

Standardiste Virtuelle

Un scénario de standard automatique faisant appel à la reconnaissance de la parole et à la synthèse vocale pour établir un dialogue avec le  correspondant est livré en standard.
Il permet la mise en place rapide d'une application fonctionnelle sans connaissances particulières.

Ajoutez toutes les interfaces souhaitées

nativIP serveur permet l'intégration de scripts PHP, Node.js (JavaScript) et Python aux scénarios vocaux. Ainsi toutes les interactions sont possibles.

Toutes les actions du correspondant sont accessibles (saisies clavier, reconnaissance de la parole) par des scripts qui en retour peuvent piloter la réponse à apporter.

Compatibilité

Grâce au support des protocoles MRCP v1/v2, nativIP serveur s'interface avec la quasi totalité des solutions de synthèse de la parole et de reconnaissance vocale du marché.


acapela group


nuance



voxygen