El perceptrón, el cerebro más pequeño que puedes construir

Fuentes: The Smallest Brain You Can Build
Imagen generada por IA con el prompt: Minimalist editorial illustration of a perceptron: one input arrow entering a circle, one output arrow leaving, with a small blue dashed decision boundary line. Soft academic style, pastel background.
Imagen generada con IA

Un perceptrón es la unidad mínima de una red neuronal: recibe un número y devuelve una respuesta de sí o no. Aunque parezca trivial, la idea, propuesta por Frank Rosenblatt en 1958, es el germen de todas las redes neuronales actuales. El artículo construye uno desde cero en Python, sin matemáticas avanzadas ni bibliotecas pesadas, usando solo un peso, un sesgo y un bucle.

La explicación arranca con una analogía humana: John Doe recibe una oferta de trabajo y decide sopesando cada factor según la importancia que le concede. Si el total supera un umbral interno, acepta; si no, rechaza. Esa es, en esencia, la lógica de un perceptrón: multiplicar cada entrada por su peso, sumar el sesgo y comprobar si el resultado supera cero.

El texto avanza de lo simple a lo revelador. Primero plantea el problema «¿este número es positivo?» y muestra cómo el perceptrón aprende de inmediato a situar la frontera de decisión en 0. Después lo complica: predecir si un alumno aprueba con notas de 0 a 100, donde la frontera correcta está en 50. Ahí se demuestra la función del sesgo: sin él, la frontera queda atrapada en el origen y la precisión se estanca en torno al 50 %; con él, alcanza el 100 %.

Se explican también dos conceptos clave del entrenamiento: las épocas (cada pasada completa por los datos) y la tasa de aprendizaje (el tamaño de cada corrección). Una tasa pequeña avanza con cautela pero despacio; una grande, rápido pero con riesgo de oscilar. El autor utiliza 0,1, un valor estable.

Otro punto es la normalización: como la corrección se multiplica por el valor de entrada, cuando las variables tienen escalas muy distintas (por ejemplo, salarios en miles junto a indicadores 0/1), las grandes ahogan a las pequeñas. Reescalar todas las entradas a un rango común —dividir por el máximo o estandarizar— permite que cada factor influya de forma justa.

El post incluye demostraciones interactivas en el navegador y termina con el código Python completo de un perceptrón funcional, breve y listo para leerse de un tirón.

Casos de uso: un perceptrón aislado solo resuelve problemas linealmente separables, pero es la pieza con la que se construyen perceptrones multicapa y redes profundas, por lo que entenderlo es el primer paso para comprender el aprendizaje profundo.

Consideraciones: el texto es divulgativo, no académico. El autor reconoce que no es hablante nativo de inglés y que está aprendiendo la materia, lo que da al artículo un tono cercano y paso a paso. La normalización se presenta en su versión más simple (dividir por el máximo) y se menciona la estandarización como alternativa más general.