Call Streams

Transmite audio de llamadas en vivo a tu sistema de AI

Accede a la API de voz de próxima generación con Sinch Call Streams. Transmite audio sin interrupciones a tus sistemas backend, lo que te permite integrar tus modelos y motores de AI preferidos para impulsar asistentes de voz en tiempo real, transcripción en vivo, biometría de voz, detección de sentimientos, analíticas de voz y traducción de idiomas bidireccional con una capacidad de respuesta inferior a 100 ms.

Image for Transmite audio de llamadas en vivo a tu sistema de AI
Más de 200 000 clientes en todo el mundo confían en nosotros

DE UN VISTAZO 

Dale a tu AI acceso en menos de 100 ms a la voz de cada persona que llama

Call Streams elimina las barreras de medios entre la telefonía y la AI. Con la transmisión de audio de llamadas en tiempo real a través de WebSockets, puedes enviar y recibir audio sin procesar en tiempo real, respetar automáticamente las interrupciones de quienes llaman y conectar cualquier motor de voz o analíticas en el flujo.

Respuestas de AI en tiempo real

Conecta las llamadas a los LLM en menos de 100 ms para que las conversaciones fluyan de forma natural, sin retrasos incómodos ni turnos de intervención recortados.

Control de audio sin restricciones 

Transmite audio continuamente de entrada y salida, dando a tu sistema control total para detectar el habla y activar interrupciones de reproducción instantáneas. 

Pila tecnológica propia y flexible

Transmite audio sin procesar a cualquier servicio de STT, TTS, biometría o analíticas para que puedas mezclar y combinar las mejores herramientas para cada tarea.

INTEGRACIÓN DE AI EN TIEMPO REAL 

Conecta las llamadas de voz directamente a los LLM con una latencia inferior a 100 ms

Call Streams ofrece audio full-duplex a través de WebSockets para que tu AI escuche y hable casi al instante. Quienes llaman experimentan un ritmo de tipo humano en lugar de pausas de varios segundos, lo que permite crear conversaciones naturales que mantienen su atención.

  • Latencia inferior a 100 ms para la entrega de audio a tu backend

  • Audio full-duplex para transmisión continua bidireccional

  • Independiente del proveedor

Imagen para Conecta las llamadas de voz directamente a los LLM con una latencia inferior a 100 ms

GESTIÓN DE INTERRUPCIONES

Permite que quienes llaman interrumpan mientras la AI escucha sin retraso

Sinch captura y escucha constantemente el audio del cliente, y solo terminará o descartará el audio reproducido cuando se reciba un comando de interrupción desde tu sistema. Esto significa que los usuarios pueden hablar libremente sin que se hable por encima de ellos, lo que permite crear un flujo conversacional más natural.

  • Descarta el audio reproducido mediante un comando de interrupción de tu sistema

  • Base potente pero fácil de usar

Imagen para Permite que quienes llaman interrumpan mientras la AI escucha sin retraso

EXPLORAR CASOS DE USO

Lo que los equipos crean con Call Streams

Agente de AI de voz  

Crea conversaciones de baja latencia y de tipo humano entre quienes llaman y los sistemas de AI que pueden gestionar tareas de asistencia, enrutamiento o ventas en vivo.

Sentimiento en tiempo real 

Analiza las emociones y la intención de quienes llaman mientras hablan para activar un enrutamiento dinámico, escalado o acciones posteriores a la llamada al instante.

Detección de fraude  

Monitorea las señales de riesgo y la biometría de voz en tiempo real para detectar patrones de fraude y detener las amenazas antes de que se intensifiquen. 

Control de calidad (QA) y cumplimiento en vivo  

Transmite audio a herramientas de seguimiento para el aseguramiento de la calidad inmediato y comprobaciones de cumplimiento normativo mientras la llamada está en curso. 

GRANDES FUNCIONALIDADES

Todo lo que necesitas para conectar la telefonía y la AI

Audio bidireccional

La transmisión full-duplex a través de WebSockets permite a la persona que llama y a tu AI hablar y escuchar al mismo tiempo.

Control de baja latencia

La capacidad de respuesta inferior a 100 ms mantiene el diálogo fluido y ofrece turnos conversacionales casi instantáneos. 

Asistencia de secuencias múltiples  

Gestiona múltiples transmisiones de audio simultáneas para potenciar aplicaciones de voz a gran escala. 

Diseño independiente del proveedor 

Integra tus motores preferidos de STT, TTS, sentimiento o fraude sin restricciones de propiedad. 

Inteligencia de llamadas en tiempo real 

Activa información estratégica, enrutamiento o acciones de asistencia de agentes mientras la persona que llama sigue en línea. 

Preguntas frecuentes

Preguntas frecuentes

Streams envía audio de llamadas en vivo a tu sistema a través de WebSockets para que puedas conectar llamadas de voz a agentes de AI o analíticas en tiempo real. Con Streams, abre una línea telefónica bidireccional y directa entre quien llama y tu sistema de AI para reducir el retraso de respuesta.

Es una conexión de medios bidireccional que permite que el audio fluya hacia y desde tu AI en tiempo real, lo que permite respuestas instantáneas, transcripción en vivo y analíticas mientras la llamada está en curso.

Streams captura audio continuamente y solo realiza la interrupción (barge-in) cuando recibe un comando de interrupción desde tu sistema.

Stream entrega audio sin procesar a medida que se habla, lo que permite crear un control en tiempo real y de baja latencia para que la AI pueda responder de forma natural sin esperar un enunciado completo o un procesamiento posterior a la llamada.

Los casos de uso comunes incluyen conectar agentes de AI impulsados por voz a llamadas y ejecutar análisis de llamadas en tiempo real, como la detección de sentimientos y otros tipos de seguimiento o automatización en vivo.

Necesitas una cuenta de Sinch Build con API de voz y un punto de conexión seguro de WebSocket donde tu servicio de AI o analíticas recibirá y enviará audio.

Sí. Streams es independiente del proveedor, por lo que puedes integrar tus servicios preferidos de voz a texto, de texto a voz, de sentimiento, biometría y detección de fraude.

Sí. Streams se ofrece como parte de la plataforma Sinch Programmable Voice , heredando su fiabilidad y cumplimiento.