Apache Flink estrena en su versión 2.3 un nuevo conector nativo para S3, llamado flink-s3-fs-native, que elimina la dependencia de Hadoop y duplica el rendimiento en operaciones de checkpoint. Hasta ahora, Flink obligaba a elegir entre dos plugins basados en Hadoop (uno compatible con escrituras exactamente-una-vez y otro con una ruta de lectura más rápida), ninguno de los cuales utiliza AWS SDK v2.
El nuevo plugin se distribuye como un archivo JAR de unos 13 MB, frente a los 30–93 MB de las opciones anteriores, y prescinde por completo de hadoop-common y de AWS SDK v1, cuyo fin de soporte llegó el 31 de diciembre de 2025. Según las pruebas publicadas por el proyecto, los checkpoints se completan en 48,8 segundos de media frente a los 90,1 segundos del plugin Presto, con mejoras de hasta 4,5 veces cuando el tamaño del estado es pequeño.
Entre sus funciones destacan las escrituras recuperables basadas en cargas multipart de S3, E/S asíncrona mediante S3TransferManager y Netty, soporte para cifrado SSE-KMS con contexto, e inyección de entropía para repartir objetos entre particiones internas de S3 y evitar limitaciones por claves calientes. La configuración por cubeta, que permitirá credenciales, regiones y políticas de cifrado independientes, está prevista para Flink 2.4. El plugin ya se utiliza en producción en varias grandes empresas tecnológicas y se ofrece como reemplazo directo sin modificar la configuración existente.
