19 Jun 2026 · Original en inglés · Artículo

Por qué DuckDB es tan rápida: claves de su diseño interno

Fuentes: DuckDB Internals: Why is DuckDB Fast?

DuckDB es una base de datos SQL analítica en proceso que se ha convertido, desde su origen como proyecto de investigación del CWI de Ámsterdam en 2019, en uno de los motores analíticos mononodo más usados y más rápidos del momento. Se distribuye como un binario único de menos de 20 MB, se instala con pip o brew, y abre directorios de Parquet, CSV o JSON como si ya fueran tablas SQL, sin servidor, sin migraciones y sin creación de esquema previa. Empresas como MotherDuck, Hex, Omni, Evidence, Fivetran y Rill, además del propio Greybeam, lo han incorporado como motor de ejecución o caché en sus plataformas.

Su velocidad se explica por un conjunto de decisiones de diseño. La primera es la ausencia de un protocolo cliente-servidor: al vivir como librería dentro del mismo proceso que la aplicación, DuckDB evita la serialización fila a fila propia de ODBC y JDBC, que según el trabajo de Mark Raasveldt y Hannes Mühleisen "Don't Hold My Data Hostage" (2017) puede ser la fase más lenta de toda la consulta. Para integrarse con Pandas o NumPy emplea replacement scans y, cuando los buffers son compatibles, lecturas zero-copy, y con Arrow comparte directamente memoria columnar tipada, lo que elimina buena parte de las conversiones.

La segunda palanca es su pipeline de compilación. DuckDB parsea el SQL con un fork del parser de Postgres para generar un AST, lo pasa por una fase de bind que resuelve nombres, tipos y referencias del catálogo, y llega al optimizador y al planificador físico, que reescriben y transforman la consulta antes de la ejecución. El artículo explica en detalle cada una de estas etapas y la capa de almacenamiento que las alimenta; la fase de ejecución se aborda en una segunda parte.

Etiquetas

duckdb analytics sql apache arrow columnar storage query optimization zero-copy parquet in-process database

Entidades mencionadas

DuckDB software

Redshift software

Polars software

BigQuery software

Snowflake software

NumPy software

CWI Amsterdam organization

In 2000 CWI established "CWI Incubator BV", a dedicated company with the aim to generate high tech spin-off companies. Some of the CWI spinoffs include: 1956: Electrologica, a pioneering Dut

MotherDuck organization

Motherfucker, a veces abreviado como mofo, mf o mf'er, es un vulgarismo del idioma inglés. Es una variante de las palabras soeces fuck y fucker.

Ver en Wikipedia

OMNI organization

Omniscient Reader: The Prophecy es una película surcoreana de fantasía y acción, coescrita con Lee Jeong-min y dirigida por Kim Byung-woo, y protagonizada por Lee Min-ho, Ahn Hyo-seop, Chae Soo-bin, S

Ver en Wikipedia

Evidence organization

«Evidence» es una canción de Faith No More, lanzado como el tercer y último sencillo de su quinto álbum de estudio, King for a Day... Fool for a Lifetime. Al igual que las otras versiones del álbum, n

Ver en Wikipedia

Apache Arrow protocol_standard

ODBC protocol_standard

JDBC protocol_standard

Mark Raasveldt person

Mr. Mark Raasveldt is a Co-Founder & serves as Chief Technology Officer at DuckDB Labs.

Hannes Mühleisen person

Hannes Mühleisen 🔈 is a creator of the DuckDB database management system and Co-founder and CEO of DuckLabs.

Rill location

Rillo de Gallo es un municipio y localidad española de la provincia de Guadalajara, en la comunidad autónoma de Castilla-La Mancha. El término municipal, ubicado en la comarca del Señorío de Molina, t

Ver en Wikipedia

Greybeam organization

Grey Damon es un actor estadounidense. Es principalmente conocido por interpretar a Jack Gibson en el drama médico Grey's Anatomy y su spin off Station 19, además de sus participaciones en series como

Ver en Wikipedia

Columnar organization

Los columnarios son un tipo de monedas de plata de la denominación del real español que fueron acuñadas por la Monarquía hispánica y sus territorios de América entre los años 1732 hasta 1773 cuando fu

Ver en Wikipedia

Hex organization

Los hexápodos son un subfilo de artrópodos, el que más especies agrupa, e incluye a los insectos, así como a varios grupos de artrópodos primitivos estrechamente relacionados con éstos, como los protu

Ver en Wikipedia

ADBC protocol_standard

Postgres software

PostgreSQL, también llamado Postgres, es un sistema de gestión de bases de datos relacional orientado a objetos y de código abierto, publicado bajo la licencia PostgreSQL, similar a la BSD o la MIT.

Ver en Wikipedia

pandas software

Fivetran organization

Five Tango Sensations es un conjunto de cinco piezas (Asleep—Loving—Anxiety—Despertar—Fear) para bandoneón y cuarteto de cuerda escrito en 1989 por el compositor argentino Astor Piazzolla. Fue estrena

Ver en Wikipedia

Enlaces

DuckDB duckdb.org

an iPhone running TPC-H at scale factor 100 duckdb.org

Don't Hold My Data Hostage duckdb.org

replacement scan duckdb.org

Arrow arrow.apache.org

Postgres parser github.com

CSV sniffer duckdb.org