Call Streams: API de voz en tiempo real a través de WebSockets

DE UN VISTAZO

Dale a tu AI acceso en menos de 100 ms a la voz de cada persona que llama

Call Streams elimina las barreras de medios entre la telefonía y la AI. Con la transmisión de audio de llamadas en tiempo real a través de WebSockets, puedes enviar y recibir audio sin procesar en tiempo real, respetar automáticamente las interrupciones de quienes llaman y conectar cualquier motor de voz o analíticas en el flujo.

Respuestas de AI en tiempo real

Conecta las llamadas a los LLM en menos de 100 ms para que las conversaciones fluyan de forma natural, sin retrasos incómodos ni turnos de intervención recortados.

Control de audio sin restricciones

Transmite audio continuamente de entrada y salida, dando a tu sistema control total para detectar el habla y activar interrupciones de reproducción instantáneas.

Pila tecnológica propia y flexible

Transmite audio sin procesar a cualquier servicio de STT, TTS, biometría o analíticas para que puedas mezclar y combinar las mejores herramientas para cada tarea.

INTEGRACIÓN DE AI EN TIEMPO REAL

Conecta las llamadas de voz directamente a los LLM con una latencia inferior a 100 ms

Call Streams ofrece audio full-duplex a través de WebSockets para que tu AI escuche y hable casi al instante. Quienes llaman experimentan un ritmo de tipo humano en lugar de pausas de varios segundos, lo que permite crear conversaciones naturales que mantienen su atención.

Latencia inferior a 100 ms para la entrega de audio a tu backend
Audio full-duplex para transmisión continua bidireccional
Independiente del proveedor

Imagen para Conecta las llamadas de voz directamente a los LLM con una latencia inferior a 100 ms

GESTIÓN DE INTERRUPCIONES

Permite que quienes llaman interrumpan mientras la AI escucha sin retraso

Sinch captura y escucha constantemente el audio del cliente, y solo terminará o descartará el audio reproducido cuando se reciba un comando de interrupción desde tu sistema. Esto significa que los usuarios pueden hablar libremente sin que se hable por encima de ellos, lo que permite crear un flujo conversacional más natural.

Descarta el audio reproducido mediante un comando de interrupción de tu sistema
Base potente pero fácil de usar

Imagen para Permite que quienes llaman interrumpan mientras la AI escucha sin retraso

EXPLORAR CASOS DE USO

Lo que los equipos crean con Call Streams

Agente de AI de voz

Crea conversaciones de baja latencia y de tipo humano entre quienes llaman y los sistemas de AI que pueden gestionar tareas de asistencia, enrutamiento o ventas en vivo.

Sentimiento en tiempo real

Analiza las emociones y la intención de quienes llaman mientras hablan para activar un enrutamiento dinámico, escalado o acciones posteriores a la llamada al instante.

Detección de fraude

Monitorea las señales de riesgo y la biometría de voz en tiempo real para detectar patrones de fraude y detener las amenazas antes de que se intensifiquen.

Control de calidad (QA) y cumplimiento en vivo

Transmite audio a herramientas de seguimiento para el aseguramiento de la calidad inmediato y comprobaciones de cumplimiento normativo mientras la llamada está en curso.

GRANDES FUNCIONALIDADES

Todo lo que necesitas para conectar la telefonía y la AI

Audio bidireccional

La transmisión full-duplex a través de WebSockets permite a la persona que llama y a tu AI hablar y escuchar al mismo tiempo.

Control de baja latencia

La capacidad de respuesta inferior a 100 ms mantiene el diálogo fluido y ofrece turnos conversacionales casi instantáneos.

Asistencia de secuencias múltiples

Gestiona múltiples transmisiones de audio simultáneas para potenciar aplicaciones de voz a gran escala.

Diseño independiente del proveedor

Integra tus motores preferidos de STT, TTS, sentimiento o fraude sin restricciones de propiedad.

Inteligencia de llamadas en tiempo real

Activa información estratégica, enrutamiento o acciones de asistencia de agentes mientras la persona que llama sigue en línea.

Preguntas frecuentes

¿Qué es Streams?

Streams envía audio de llamadas en vivo a tu sistema a través de WebSockets para que puedas conectar llamadas de voz a agentes de AI o analíticas en tiempo real. Con Streams, abre una línea telefónica bidireccional y directa entre quien llama y tu sistema de AI para reducir el retraso de respuesta.

¿Qué es la transmisión de audio de llamadas en tiempo real a través de WebSockets?

Es una conexión de medios bidireccional que permite que el audio fluya hacia y desde tu AI en tiempo real, lo que permite respuestas instantáneas, transcripción en vivo y analíticas mientras la llamada está en curso.

¿Cómo gestiona Streams las interrupciones y los turnos de intervención?

Streams captura audio continuamente y solo realiza la interrupción (barge-in) cuando recibe un comando de interrupción desde tu sistema.

¿Por qué usar Streams en lugar de esperar a las transcripciones?

Stream entrega audio sin procesar a medida que se habla, lo que permite crear un control en tiempo real y de baja latencia para que la AI pueda responder de forma natural sin esperar un enunciado completo o un procesamiento posterior a la llamada.

¿Qué puedo crear con Streams?

Los casos de uso comunes incluyen conectar agentes de AI impulsados por voz a llamadas y ejecutar análisis de llamadas en tiempo real, como la detección de sentimientos y otros tipos de seguimiento o automatización en vivo.

¿Cuáles son los requisitos previos para utilizar Streams?

Necesitas una cuenta de Sinch Build con API de voz y un punto de conexión seguro de WebSocket donde tu servicio de AI o analíticas recibirá y enviará audio.

¿Puedo usar mis propios motores de STT, TTS o analíticas?

Sí. Streams es independiente del proveedor, por lo que puedes integrar tus servicios preferidos de voz a texto, de texto a voz, de sentimiento, biometría y detección de fraude.

¿Streams forma parte de Programmable Voice (Voz programable)?

Sí. Streams se ofrece como parte de la plataforma Sinch Programmable Voice , heredando su fiabilidad y cumplimiento.

Transmite audio de llamadas en vivo a tu sistema de AI