Wirewiki, una web para inspeccionar infraestructura de internet como nombres de dominio, necesitaba un sistema de autocompletado capaz de sugerir dominios al instante mientras el usuario escribe. El objetivo era ambicioso: que en el 99 % de los casos los resultados estuvieran listos antes incluso de que el usuario soltara la tecla, es decir, una latencia p99 de 0 ms.
Para lograrlo se combinan dos técnicas. En el cliente, al pulsar una tecla se solicita de forma anticipada el prefijo escrito más el siguiente carácter posible, de modo que cuando el usuario libera la tecla el navegador ya puede mostrar las sugerencias. Esto concede un presupuesto temporal equivalente a la suma de dos pulsaciones y la pausa entre ellas, que en pruebas de tecleo rápido alcanzó los 121 ms en el percentil 99.
En el servidor, el motor divide el espacio de búsqueda en una cabeza y una cola. La cabeza usa la lista Tranco, con el millón de dominios más populares, almacenada en un trie en memoria que devuelve las ocho mejores sugerencias para cada prefijo en tiempo constante. La cola recurre a las listas CZDS de ICANN para la mayoría de gTLD, comprimidas por diferencias en bloques de 256 nombres sobre disco SSD y un directorio en memoria de 27 MB; una búsqueda binaria en el directorio seguida de un escaneo lineal del bloque correspondiente cubre los 240 millones de dominios en apenas 2,5 GB.
En pruebas de estrés, un modelo de lenguaje generó 720 000 consultas simulando 60 000 dominios tecleados. La API responde en menos de 2 ms en la mayoría de casos y, con Nginx delante, mantiene 15 ms en el percentil 99 incluso a 1 600 solicitudes por segundo. En la práctica, la latencia total ronda el tiempo de ida y vuelta a Cloudflare más 10 ms.
El autor reconoce la limitación de operar con un único servidor en Europa, lo que penaliza a usuarios de América con 100-200 ms adicionales. El caché de CDN y el umbral de Nielsen de 100 ms compensan en parte, pero alcanzar el objetivo p99 0 ms requeriría replicar el servicio en varias regiones.
