El artículo de Arpit Bhayani, "Databases Were Not Designed For This", explora una brecha crítica que surge con la adopción de sistemas de IA agentic en las arquitecturas de bases de datos tradicionales. Durante décadas, el diseño de bases de datos se ha basado en un 'contrato implícito': aplicaciones escritas por humanos, con código determinista, consultas predecibles y revisiones de desarrolladores. Este contrato permitía optimizaciones como estadísticas de planificación de consultas, caches y pools de conexiones dimensionados para un uso predecible. Sin embargo, la IA agentic rompe este contrato en múltiples niveles.
La principal diferencia radica en que los agentes no generan consultas de manera determinista. Razonan para construir consultas, lo que resulta en patrones de acceso a datos impredecibles y consultas complejas que pueden no estar cubiertas por los índices existentes. Esto puede llevar a tiempos de ejecución de consultas inesperadamente largos, agotamiento de pools de conexiones y problemas de rendimiento. Además, los agentes pueden mantener conexiones abiertas durante períodos prolongados mientras procesan información, lo que agrava el problema del agotamiento de conexiones.
Otro aspecto crucial es que los agentes pueden realizar escrituras autónomas, a menudo basadas en una comprensión incompleta de la tarea, lo que puede resultar en escrituras incorrectas, duplicadas o incluso en bucles de escritura. Para mitigar estos riesgos, el artículo propone varias soluciones: establecer timeouts de consulta a nivel de rol, implementar soft deletes (eliminaciones lógicas) para evitar la pérdida de datos, usar registros de eventos append-only para auditoría y, crucialmente, incorporar claves de idempotencia en las operaciones de escritura. Las claves de idempotencia garantizan que las reintentos de una operación no resulten en efectos secundarios no deseados.
Finalmente, el artículo enfatiza la necesidad de pools de conexiones dedicados para cargas de trabajo de agentes, dimensionados de forma independiente de las aplicaciones tradicionales, considerando el tiempo de inferencia de LLMs y la posibilidad de que una sola tarea agentique genere múltiples sub-tareas concurrentes. En resumen, el artículo advierte sobre la necesidad de reevaluar y adaptar las prácticas de diseño de bases de datos para acomodar las características únicas de la IA agentic, priorizando la seguridad, la auditabilidad y la resiliencia sobre la simple optimización del rendimiento.
