Aakash y Viswesh, ex ingenieros de Google y Windsurf, han lanzado Canary (YC W26), una herramienta de control de calidad (QA) impulsada por inteligencia artificial diseñada para mejorar la verificación de código y prevenir errores en producción. Canary se conecta al código base de una aplicación, analiza las diferencias introducidas en las solicitudes de extracción (PRs) y genera pruebas automatizadas que simulan flujos de usuario reales. Estas pruebas se ejecutan contra una versión previa de la aplicación y los resultados, incluyendo grabaciones de pantalla, se comentan directamente en la PR, identificando problemas antes de la integración. La herramienta también permite crear suites de regresión y generar pruebas a partir de descripciones en lenguaje natural. Un cliente de construcción detectó una desviación de $1.600 en un flujo de facturación gracias a Canary. Los fundadores destacan que Canary supera a modelos de lenguaje como GPT-4, Claude Code y Sonnet en la cobertura de pruebas, según su propio benchmark QA-Bench v0. La herramienta integra diversas modalidades de QA, incluyendo análisis de código, emulación de dispositivos y verificación visual, y requiere una infraestructura especializada para su funcionamiento fiable.
