Databricks presentó este lunes, en el marco del Data + AI Summit, LTAP (Lake Transactional/Analytical Processing), una nueva arquitectura de procesamiento de datos que unifica cargas transaccionales, analíticas, de streaming y operativas sobre una única copia de almacenamiento en el data lake. La propuesta elimina por diseño las capas de ETL, las réplicas y los pipelines que durante décadas han definido la infraestructura de datos empresarial.
LTAP se apoya en Lakebase, la base de Postgres sin servidor de Databricks sobre almacenamiento abierto de objetos. Lanzada hace un año, Lakebase ya atiende a miles de clientes —entre ellos Block, Ensemble, Superhuman y Zillow— y gestiona 12 millones de lanzamientos de bases de datos al día. Según la compañía, LTAP se diferencia del enfoque HTAP clásico, que sacrificaba el aislamiento de cargas, y de las soluciones Zero ETL, que ocultaban el pipeline CDC en lugar de eliminarlo. La arquitectura unifica los datos en la capa de almacenamiento, gobernados a través de Unity Catalog y compatibles con formatos abiertos como Delta e Iceberg, de modo que las cargas transaccionales y analíticas escalan de forma independiente.
Databricks también anunció nuevas capacidades para Lakebase: recuperación ante desastres entre nubes y regiones, ramificación estilo Git y snapshots para experimentar sobre datos de producción, y operaciones autónomas de base de datos. LTAP estará disponible próximamente como parte de Lakebase.
