PII GUI es una aplicación de escritorio de código abierto, publicada bajo licencia AGPL v3.0, diseñada para localizar y eliminar información personal identificable (PII) en documentos PDF, Markdown y de texto plano. Su principio rector es la privacidad local: todo el procesamiento ocurre en el dispositivo del usuario y el contenido de los documentos nunca abandona la máquina; el único acceso a la red es la descarga inicial y opcional de los modelos de detección desde Hugging Face.
La aplicación se construye sobre Tauri 2, con un frontend en React 19 y TypeScript y un backend en Rust. Admite tres motores de detección combinables: un conjunto de reglas regex integradas, válido para una primera pasada rápida sobre correos, teléfonos, URL, fechas, números de cuenta y secretos; el modelo OpenAI Privacy Filter, pensado para documentos extensos en inglés con una taxonomía amplia de privacidad; y BardsAI EU PII, orientado a textos en idiomas europeos donde importan nombres, direcciones y patrones de identificadores. Los resultados se etiquetan con una taxonomía fija que cubre cuentas, direcciones, correos, personas, teléfonos, URL, fechas y secretos.
Antes de exportar, el usuario revisa cada coincidencia en un workbench y decide manualmente cuáles se conservan o se eliminan. En el caso de los PDF, la redacción no se limita a tapar el texto: la aplicación graba rectángulos opacos en las páginas renderizadas mediante pdf-lib, de modo que el texto subyacente no se puede recuperar. El sistema incluye cola de tareas para documentos largos con fragmentación por tokens y páginas, persistencia local en SQLite de pestañas, reglas personalizadas e historiales, e interfaz traducida al inglés, coreano y japonés.
PII GUI resulta útil para periodistas, abogados, equipos de cumplimiento, investigadores y cualquier profesional que comparta documentos internos sin querer filtrar datos sensibles. Entre sus limitaciones figura que la calidad de la detección neuronal depende del modelo descargado y de su cobertura lingüística, y que las reglas regex pueden generar falsos positivos en formatos no estándar. El proyecto se distribuye con instaladores para macOS, Windows y Linux, admite reglas personalizadas por el usuario y contempla en su hoja de ruta mejoras de accesibilidad, exportación multilingüe e integración con agentes de programación.
