Call Streams : API vocale en temps réel via WebSockets

EN UN COUP D’ŒIL

Offrez à votre IA un accès à la voix de chaque appelant en moins de 100 ms

Call Streams retire les barrières de média entre la téléphonie et l’IA. Grâce à la diffusion audio des appels en temps réel via WebSockets, vous pouvez envoyer et recevoir de l’audio brut en temps réel, respecter automatiquement les interruptions des appelants et brancher n’importe quel moteur vocal ou de statistiques dans le flux.

Réponses de l’IA en temps réel

Connectez les appels aux LLM en moins de 100 ms afin que les conversations se déroulent naturellement sans retard gênant ni tour de parole tronqué.

Contrôle audio sans restriction

Diffusez l’audio en continu en entrée et en sortie, offrant à votre système un contrôle total pour détecter la parole et déclencher des interruptions de lecture instantanées.

Architecture « bring-your-own » flexible

Acheminez l’audio brut vers n’importe quel service de STT, TTS, biométrie ou de statistiques afin de pouvoir combiner et associer les meilleurs outils pour chaque tâche.

INTÉGRATION DE L’IA EN TEMPS RÉEL

Connectez les appels vocaux directement aux LLM avec une latence inférieure à 100 ms

Call Streams fournit un son full-duplex via WebSockets pour que votre IA entende et parle presque instantanément. Les appelants font l’expérience d’un rythme similaire à celui des humains au lieu de pauses de plusieurs secondes, ce qui permet de créer des conversations naturelles qui maintiennent leur engagement.

Latence inférieure à 100 ms pour la livraison audio vers votre backend
Audio full-duplex pour un streaming bidirectionnel continu
Indépendant du fournisseur

Image pour Connectez les appels vocaux directement aux LLM avec une latence inférieure à 100 ms

GESTION DES INTERRUPTIONS

Laissez les appelants interrompre pendant que l’IA écoute sans retard

Sinch capture et écoute constamment l’audio du client, et ne mettra fin ou n’ignorera l’audio lu que lorsqu’une commande d’interruption sera reçue de votre système. Cela signifie que les utilisateurs peuvent parler librement sans qu’on leur coupe la parole, ce qui permet de créer un flux de conversation plus naturel.

Ignore l’audio lu sur commande d’interruption de votre système
Une fondation puissante mais facile à utiliser

Image pour Laissez les appelants interrompre pendant que l'IA écoute sans retard

EXPLOREZ LES ÉTUDES DE CAS

Ce que les équipes construisent avec Call Streams

Agent d’IA vocal

Construisez des conversations à faible latence et semblables à celles des humains entre les appelants et les systèmes d’IA capables de gérer en direct le support, le routage ou les tâches de vente.

Sentiment en temps réel

Analysez les émotions et l’intention des appelants pendant qu’ils parlent pour déclencher instantanément un routage dynamique, une remontée ou des actions post-appel.

Détection de fraude

Surveillez les signaux de risque et la biométrie de la voix en temps réel pour repérer les modèles de fraude et arrêter les menaces avant qu’elles ne s’aggravent.

Assurance qualité et conformité en direct

Diffusez l’audio vers des outils de suivi pour des contrôles immédiats d’assurance qualité et de conformité réglementaire pendant que l’appel est en cours.

EXCELLENTES FONCTIONNALITÉS

Tout ce dont vous avez besoin pour faire le pont entre la téléphonie et l’IA

Audio bidirectionnel

Le streaming full-duplex via WebSockets permet à l’appelant et à votre IA de parler et d’écouter en même temps.

Contrôle à faible latence

La réactivité inférieure à 100 ms maintient la fluidité du dialogue et permet des tours de parole presque instantanés.

Support multi-flux

Gérez plusieurs flux audio simultanés pour alimenter des applications vocales à grande échelle.

Design indépendant du fournisseur

Intégrez vos moteurs préférés de STT, TTS, d’analyse des sentiments ou de fraude sans contraintes propriétaires.

Intelligence des appels en temps réel

Déclenchez des statistiques, un routage ou des actions d’assistance par agent pendant que l’appelant est encore en ligne.

FAQ

Questions fréquemment posées

Qu’est-ce que Streams ?

Streams permet d’envoyer l’audio des appels en direct vers votre système via WebSockets afin que vous puissiez connecter des appels vocaux à des agents d’IA ou à des statistiques en temps réel. Avec Streams, ouvrez une ligne téléphonique directe bidirectionnelle entre l’appelant et votre système d’IA afin de réduire le retard de réponse.

Qu’est-ce que la diffusion audio d’appels en temps réel via WebSockets ?

Il s’agit d’une connexion de média bidirectionnelle qui permet à l’audio de circuler vers et depuis votre IA en temps réel, permettant des réponses instantanées, une transcription en direct et des statistiques pendant que l’appel est en cours.

Comment Streams gère-t-il les interruptions et les tours de parole ?

Streams capture le son en continu et n’effectue une interruption (barge-in) que lorsqu’il reçoit une commande d’interruption de votre système.

Pourquoi utiliser Streams au lieu d’attendre les transcriptions ?

Stream diffuse l’audio brut tel qu’il est prononcé, ce qui permet de créer un contrôle en temps réel à faible latence afin que l’IA puisse répondre naturellement sans attendre une déclaration complète ou un traitement post-appel.

Que puis-je construire avec Streams ?

Les études de cas courantes incluent la possibilité de connecter des agents d’IA vocaux aux appels et d’exécuter des analyses d’appels en temps réel telles que la détection de sentiments et d’autres processus de suivi ou d’automatisation en direct.

Quelles sont les conditions préalables à l’utilisation de Streams ?

Vous avez besoin d’un compte Sinch Build avec une API vocale et un point de terminaison WebSocket sécurisé où votre IA ou service de statistiques recevra et enverra de l’audio.

Puis-je utiliser mes propres moteurs de STT, TTS ou de statistiques ?

Oui. Streams est indépendant du fournisseur, vous pouvez donc intégrer vos services préférés pour la reconnaissance vocale, la synthèse vocale, l’analyse des sentiments, la biométrie et la détection de fraude.

Streams fait-il partie de Programmable Voice ?

Oui. Streams est fourni dans le cadre de la plateforme Sinch Programmable Voice , héritant de sa fiabilité et de sa conformité.

Diffusez l’audio des appels en direct vers votre système d’IA