Call Streams

Diffusez l’audio des appels en direct vers votre système d’IA

Accédez à la Voice API de nouvelle génération avec Sinch Call Streams. Diffusez de l’audio en continu vers vos systèmes backend, ce qui vous permet d’intégrer vos modèles et moteurs d’IA préférés pour alimenter des assistants vocaux en temps réel, des transcriptions en direct, la biométrie de la voix, la détection des sentiments, des statistiques vocales et des traductions bidirectionnelles avec une réactivité inférieure à 100 ms.

Image for Diffusez l'audio des appels en direct vers votre système d'IA
Plus de 200 000 clients à travers le monde nous font confiance

EN UN COUP D’ŒIL 

Offrez à votre IA un accès à la voix de chaque appelant en moins de 100 ms

Call Streams retire les barrières de média entre la téléphonie et l’IA. Grâce à la diffusion audio des appels en temps réel via WebSockets, vous pouvez envoyer et recevoir de l’audio brut en temps réel, respecter automatiquement les interruptions des appelants et brancher n’importe quel moteur vocal ou de statistiques dans le flux.

Réponses de l’IA en temps réel

Connectez les appels aux LLM en moins de 100 ms afin que les conversations se déroulent naturellement sans retard gênant ni tour de parole tronqué.

Contrôle audio sans restriction 

Diffusez l’audio en continu en entrée et en sortie, offrant à votre système un contrôle total pour détecter la parole et déclencher des interruptions de lecture instantanées. 

Architecture « bring-your-own » flexible

Acheminez l’audio brut vers n’importe quel service de STT, TTS, biométrie ou de statistiques afin de pouvoir combiner et associer les meilleurs outils pour chaque tâche.

INTÉGRATION DE L’IA EN TEMPS RÉEL 

Connectez les appels vocaux directement aux LLM avec une latence inférieure à 100 ms

Call Streams fournit un son full-duplex via WebSockets pour que votre IA entende et parle presque instantanément. Les appelants font l’expérience d’un rythme similaire à celui des humains au lieu de pauses de plusieurs secondes, ce qui permet de créer des conversations naturelles qui maintiennent leur engagement.

  • Latence inférieure à 100 ms pour la livraison audio vers votre backend

  • Audio full-duplex pour un streaming bidirectionnel continu

  • Indépendant du fournisseur

Image pour Connectez les appels vocaux directement aux LLM avec une latence inférieure à 100 ms

GESTION DES INTERRUPTIONS

Laissez les appelants interrompre pendant que l’IA écoute sans retard

Sinch capture et écoute constamment l’audio du client, et ne mettra fin ou n’ignorera l’audio lu que lorsqu’une commande d’interruption sera reçue de votre système. Cela signifie que les utilisateurs peuvent parler librement sans qu’on leur coupe la parole, ce qui permet de créer un flux de conversation plus naturel.

  • Ignore l’audio lu sur commande d’interruption de votre système

  • Une fondation puissante mais facile à utiliser

Image pour Laissez les appelants interrompre pendant que l'IA écoute sans retard

EXPLOREZ LES ÉTUDES DE CAS

Ce que les équipes construisent avec Call Streams

Agent d’IA vocal  

Construisez des conversations à faible latence et semblables à celles des humains entre les appelants et les systèmes d’IA capables de gérer en direct le support, le routage ou les tâches de vente.

Sentiment en temps réel 

Analysez les émotions et l’intention des appelants pendant qu’ils parlent pour déclencher instantanément un routage dynamique, une remontée ou des actions post-appel.

Détection de fraude  

Surveillez les signaux de risque et la biométrie de la voix en temps réel pour repérer les modèles de fraude et arrêter les menaces avant qu’elles ne s’aggravent. 

Assurance qualité et conformité en direct  

Diffusez l’audio vers des outils de suivi pour des contrôles immédiats d’assurance qualité et de conformité réglementaire pendant que l’appel est en cours. 

EXCELLENTES FONCTIONNALITÉS

Tout ce dont vous avez besoin pour faire le pont entre la téléphonie et l’IA

Audio bidirectionnel

Le streaming full-duplex via WebSockets permet à l’appelant et à votre IA de parler et d’écouter en même temps.

Contrôle à faible latence

La réactivité inférieure à 100 ms maintient la fluidité du dialogue et permet des tours de parole presque instantanés. 

Support multi-flux  

Gérez plusieurs flux audio simultanés pour alimenter des applications vocales à grande échelle. 

Design indépendant du fournisseur 

Intégrez vos moteurs préférés de STT, TTS, d’analyse des sentiments ou de fraude sans contraintes propriétaires. 

Intelligence des appels en temps réel 

Déclenchez des statistiques, un routage ou des actions d’assistance par agent pendant que l’appelant est encore en ligne. 

FAQ

Questions fréquemment posées

Streams permet d’envoyer l’audio des appels en direct vers votre système via WebSockets afin que vous puissiez connecter des appels vocaux à des agents d’IA ou à des statistiques en temps réel. Avec Streams, ouvrez une ligne téléphonique directe bidirectionnelle entre l’appelant et votre système d’IA afin de réduire le retard de réponse.

Il s’agit d’une connexion de média bidirectionnelle qui permet à l’audio de circuler vers et depuis votre IA en temps réel, permettant des réponses instantanées, une transcription en direct et des statistiques pendant que l’appel est en cours.

Streams capture le son en continu et n’effectue une interruption (barge-in) que lorsqu’il reçoit une commande d’interruption de votre système.

Stream diffuse l’audio brut tel qu’il est prononcé, ce qui permet de créer un contrôle en temps réel à faible latence afin que l’IA puisse répondre naturellement sans attendre une déclaration complète ou un traitement post-appel.

Les études de cas courantes incluent la possibilité de connecter des agents d’IA vocaux aux appels et d’exécuter des analyses d’appels en temps réel telles que la détection de sentiments et d’autres processus de suivi ou d’automatisation en direct.

Vous avez besoin d’un compte Sinch Build avec une API vocale et un point de terminaison WebSocket sécurisé où votre IA ou service de statistiques recevra et enverra de l’audio.

Oui. Streams est indépendant du fournisseur, vous pouvez donc intégrer vos services préférés pour la reconnaissance vocale, la synthèse vocale, l’analyse des sentiments, la biométrie et la détection de fraude.

Oui. Streams est fourni dans le cadre de la plateforme Sinch Programmable Voice , héritant de sa fiabilité et de sa conformité.