16 Feb 2026 · Original en inglés · Resumen IA

Heretic: herramienta elimina censura de IA automáticamente

Fuentes: New tool automates removal of censorship from language models

Un nuevo conjunto de herramientas llamado Heretic está automatizando la eliminación de restricciones de seguridad (censura) de modelos de lenguaje basados en transformadores, sin necesidad de costosos procesos de reentrenamiento. Desarrollado por P-E-W y disponible en GitHub, Heretic combina técnicas avanzadas de ablación direccional con un optimizador basado en TPE y Optuna. Esto permite que el proceso sea completamente automático, minimizando tanto las respuestas negativas a indicaciones consideradas 'dañinas' como la desviación del modelo original (KL Divergence). Los usuarios pueden utilizar Heretic sin necesidad de conocimientos técnicos profundos sobre el funcionamiento interno de los modelos de lenguaje. Las versiones de modelos decensurados generadas con Heretic, como las basadas en Gemma, han sido bien recibidas por la comunidad, mostrando una supresión de respuestas negativas comparable a la de expertos, pero con menor impacto en la capacidad general del modelo. El software soporta una variedad de modelos densos y arquitecturas MoE, aunque no todos los tipos. El proceso de decensuración puede tardar entre 45 minutos y una hora, dependiendo del tamaño del modelo y el hardware utilizado, y se puede acelerar mediante la cuantización. Además de la decensuración, Heretic ofrece herramientas para la investigación sobre la interpretación interna de los modelos, generando visualizaciones y métricas detalladas.

Temas

desarrollo

Etiquetas

heretic language models censorship artificial intelligence transformers gemma optuna github

Entidades mencionadas

pytorch software

Hugging Face organization

Hugging Face, Inc. es una empresa franco-estadounidense que desarrolla herramientas para crear aplicaciones utilizando el aprendizaje automático. Es conocida por su biblioteca de transformadores cread

Ver en Wikipedia

RTX 5090 hardware

GPT-OSS 20B Heretic software

Heretic GPT 20b software

Qwen3-4B-Instruct-2507-heretic software

Llama-3.1-8B-Instruct software

bitsandbytes software

RTX 3090 hardware

PaCMAP software

Lai 2025 regulation

La temporada 2025 de la Liga Nacional de Baloncesto fue la decimonovena temporada de la historia de la competición dominicana de baloncesto. La temporada regular contó con 56 partidos en general, esta

Ver en Wikipedia

Optuna organization

Opuntia ficus-indica, comúnmente conocida, entre otros nombres, como nopal, higuera (de pala), palera, pera de cactus, penca, tuna, tuno, tunera, chumbera e higo, es una especie arbustiva del género O

Ver en Wikipedia

Heretic software

transformer-based language models software

Arditi et al. 2024 event

Python software

Python es un lenguaje de alto nivel de programación interpretado cuya filosofía hace hincapié en la legibilidad de su código. Se trata de un lenguaje de programación multiparadigma, ya que soporta par

Ver en Wikipedia