OpenAI está probando internamente un nuevo modelo de voz bautizado como GPT-Bidi-1 dentro de ChatGPT, según detectó el portal TestingCatalog a partir de referencias en el código de la aplicación. La denominación «Bidi» alude a «bidirectional» (bidireccional), una capacidad que permitiría al sistema escuchar y hablar de forma simultánea, en lugar de esperar a que el usuario termine su intervención para procesar la respuesta.
Las pruebas tempranas, realizadas por un grupo reducido de usuarios, muestran que el modelo puede emitir pequeñas confirmaciones verbales durante las pausas, cambiar de tarea en mitad de su ejecución y mantener con mayor consistencia el contexto acumulado en conversaciones largas, un punto débil habitual de los asistentes de voz. También reduciría las interrupciones prematuras provocadas por silencios.
Aunque la compañía no ha confirmado oficialmente el despliegue, las filtraciones apuntan a que Bidi 1 podría llegar próximamente a ChatGPT e incluso a Codex. La novedad encaja con la estrategia de OpenAI de reforzar la voz como vía de interacción natural, sumándose a la incorporación de agentes y herramientas de programación que la compañía viene preparando para su plataforma.
