Una década de despliegues: cómo ha cambiado la producción

Fuentes: Ten years of deploying to production

Este artículo, escrito por Brandon Vincent, reflexiona sobre una década de experiencia en el despliegue de aplicaciones en producción, contrastando la situación de 2018 con la de 2026. En 2018, la empresa donde trabajaba tenía un equipo de 'Ops' (operaciones) que controlaba estrictamente el acceso a la producción. Este equipo, físicamente aislado en una sala, era responsable de la infraestructura y el despliegue, lo que resultaba en un proceso lento y engorroso: los despliegues ocurrían solo cada dos semanas. Esto generaba problemas, ya que los modelos de machine learning (ML) en producción a menudo presentaban comportamientos inesperados, afectando a los clientes. La falta de un flujo de trabajo eficiente para el despliegue, combinado con la necesidad de aprobación manual por parte del equipo de Ops, impedía una rápida corrección de estos problemas.

El autor, parte de un equipo de ciencia de datos, se enfrentó a este desafío y, adoptando principios de DevOps, se propuso mejorar el proceso. Esto implicó entender el flujo de trabajo existente, aprender herramientas como Chef (un gestor de configuración) y crear un repositorio PyPi interno para gestionar dependencias de Python. Se implementó un sistema de versionado basado en etiquetas de Git, se introdujo la revisión de código a través de Pull Requests (PRs) y se creó una plantilla de receta Chef para aplicaciones Python. El resultado fue un proceso de despliegue más ágil y la resolución de los problemas que afectaban a los clientes.

La reflexión final del autor contrasta la mentalidad de 2018, donde el equipo de Ops se veía como un guardián de la producción, con la de 2026, donde un equipo de 'Platform Engineering' se enfoca en acelerar el desarrollo y aumentar la resiliencia de la producción. La diferencia clave radica en la priorización de la experiencia del desarrollador y la automatización del proceso de CI/CD (Continuous Integration/Continuous Delivery). En 2026, la espera en CI/CD se considera un incidente menor, y la resolución de problemas en producción debe ser transparente y fácil de diagnosticar. El artículo destaca la evolución de la cultura DevOps y la importancia de eliminar las barreras que impiden a los desarrolladores desplegar y mantener sus aplicaciones de manera eficiente.