Un experto en WebRTC cuestiona públicamente la decisión de OpenAI de utilizar este protocolo para su tecnología de voz IA. El especialista, quien trabajó en implementaciones de WebRTC en Twitch y Discord, advierte que el protocolo es inadecuado para agentes de voz porque está diseñado para degradar agresivamente paquetes de audio durante condiciones de red deficientes, priorizando latencia sobre precisión. Según el análisis, WebRTC carece de buffering y renderiza únicamente en función del tiempo de llegada de paquetes, lo que obliga a OpenAI a introducir latencia artificial y arriesgar retransmisiones. El protocolo añade entre 20 y 200 milisegundos de latencia mediante su jitter buffer dinámico. Además, la configuración de una conexión WebRTC requiere un mínimo de ocho viajes de ida y vuelta (RTT), lo que ralentiza el inicio de sesiones. A escala, el protocolo presenta limitaciones de puertos disponibles y conflictos con firewalls corporativos, obligando a los servicios a implementar soluciones alternativas como multiplexar conexiones en un único puerto. El experto concluye que las técnicas de balanceo de carga personalizadas de OpenAI, aunque impresionantes a su escala, son esencialmente parches necesarios debido a fallos fundamentales en el diseño del protocolo.
Experto advierte que WebRTC no es ideal para agentes de voz IA
