Binario vs. JSON: ¿Mejor rendimiento en bases de datos?

Fuentes: Binary Encodings Could Replace JSON in Databases, Boosting Performance

Un artículo de jincongho.com explora cómo las codificaciones binarias de JSON podrían reemplazar al JSON tradicional en bases de datos, impulsando significativamente el rendimiento de las consultas repetidas. El análisis revela que el cuello de botella no es tanto el JSON en sí, sino el proceso de análisis (parsing) del texto JSON. Microbenchmarks con simdjson muestran que el parsing de un JSON realista puede tardar casi dos minutos y medio para un millón de filas. El artículo propone un diseño de codificación binaria minimalista que permite un aumento de velocidad de 2346x en comparación con el parsing tradicional, logrando tiempos de consulta de solo 58.3 nanosegundos para una consulta compleja en un dataset de 617KB. Aunque existen alternativas como BSON, CBOR y MessagePack, estas presentan desventajas como mayor sobrecarga de almacenamiento o la falta de acceso aleatorio. El artículo concluye que la elección del formato binario óptimo depende de los objetivos específicos de rendimiento y las compensaciones inherentes a cada diseño.